Künstliche Intelligenz in der Wirtschaftsprüfung – Vision vs. Realität
Zur Umsetzung der Visionen in die Realität muss die KI-Entwicklung use-case-bezogen erfolgen.
Die Diskussion um Künstliche Intelligenz (KI) wurde durch die Entwicklungen der letzten zwei Jahre nach Aufkommen der generativen Artificial Intelligence (AI) im Zusammenhang mit ChatGPT zu Recht befeuert. Dennoch haben viele Unternehmen erst jetzt realisiert, dass die Entwicklung von KI-Instrumenten nur mit erheblichen Investitionen und unter massivem Einsatz der Mitarbeiter möglich ist und sich sehr schnell die Frage stellt, ob die ursprünglichen Visionen und Ideen in die Realität umsetzbar sind.
Große Wirtschaftsprüfungsgesellschaften nehmen die Mitarbeiter bereits in die technologische Entwicklung mit, sie probieren aus, studieren und entwickeln Ideen auf Basis von unternehmenseigenen ChatGPT. Allerdings ist ChatGPT nur der Anfang der Geschichte. Allein die Vision, dass menschliche Intelligenz durch künstliche Intelligenz verdrängt werden könnte, reicht nicht aus. Wenn es auf die nächsten zwei Stufen der Entwicklung geht, KI-Modelle mit speziellem WP-Know-how zu entwickeln und schließlich End-to-End-Prozesse unter Zuhilfenahme von KI zu gestalten, ist noch ein weiterer Weg zu gehen, um von dem visionären Hype um KI zur Anwendungsrealität zu kommen.
Dem “Wirtschaftszweig” Wirtschaftsprüfung wird nachsagt, dass disruptive Technologieentwicklungen dort zuletzt, d. h. später als bei ihren Mandanten, ankommen. Ein wenig entspricht dies der Realität von vielen Wirtschaftsprüfungsgesellschaften, deren Tätigkeiten von Exceltabellen und Powerpointdarstellungen geprägt sind und weniger durch das Training von neuronalen Netzen, um das fundierte und hochqualifizierte Wissen vieler Generationen von Wirtschaftsprüfern in die nächste Generation weiterzutragen.
KI in der Wirtschaftsprüfung ist allerdings kein “Hokuspokus”. Im Gegenteil – es wimmelt von sog. Use-Cases, an denen man sich eher orientieren sollte als an Visionen um KI, bei denen “die Welt aus den Angeln gehoben wird” und die den heutigen Hype prägen. Beispiele für Anwendungen sind die End-to-End-Erstellung der vielen Berichte und das Auslesen von Verträgen, z. B. für die Leasingbilanzierung. Obwohl die technische Rekonstruktion von Tabellen nicht trivial ist, ist dies heute mit KI gut möglich, und es spart erheblich Zeit, wenn die Prüfer die Zahlen nicht mehr abtippen müssen. Pretrained KI-Modelle ermöglichen es, Gutachten, z. B. im Pensionsbereich, genauso wie Gewerbesteuerbescheide, die sehr unterschiedliche Formate haben, systematisch zu erfassen, um sie End-to-End zu prüfen. Die Prüfung in komplexen Bereichen mit sehr vielen regulatorischen Vorgaben, z. B. bei den International Financial Reporting Standards (IFRS) und der Corporate Sustainablity Reporting Directive (CSRD), lässt sich in erheblichem Maße mit KI unterstützen. Prozessketten werden in den Delivery-Centern nun mit KI geschlossen. Allein bei Compliance-Abgleichen, z. B. bei der Analyse der Anhangangaben, die bisher manuell durchgeführt wurde, können pro Bericht zwei bis drei Tage eingespart werden, was bei großen Wirtschaftsprüfungsgesellschaften (WPG) mit 2000–5000 Berichten durchaus ins Gewicht fällt.
WPG befinden sich heute in einer drastischen Transformation. Das bisherige Angebot für eine Abschlussprüfung, bei dem mit Preis mal Menge gerechnet wurde, wird zwar noch den Einkaufsabteilungen der großen Gesellschaften vorgetragen. Der Realität entspricht die Kalkulation “Menge x Preis” bei den hohen Technologieinvestments jedoch nur noch teilweise. Vielmehr steigen durch die Weiterentwicklung der Technologie die Entwicklungskosten in gravierendem Umfang, und auch diese Investitionen müssen sich amortisieren, sprich den Kunden in Rechnung gestellt werden.
Die großen WPG fragen sich zudem, ob ihre Investitionen in die weltweiten Delivery-Center noch zeitgemäß sind. Die Center tragen maßgeblich zur Standardisierung bei, die eine Automation ermöglicht. Die Zukunft der Center könnte darin liegen, sie schrittweise in Trainingscenter für KI-Modelle zu wandeln.
Der Fachkräftemangel gilt auch für die Wirtschaftsprüfung. In den nächsten Jahren werden möglicherweise nicht mehr so viele Menschen das WP-Examen ablegen. Und die Komplexität der fachlichen Anforderungen nimmt zu: Allein bei der CSRD-Berichterstattung sind die Datenquellen so umfangreich, dass sie selbst ChatGPT noch nicht vollständig aufnehmen kann. Die Erwartungshaltung an einen CSRD-Bericht wird es allerdings trotzdem sein, dass die darin enthaltenen Aussagen zumindest nicht falsch sind. Pillar 2 beispielsweise zeigt, dass heute Regeln im Finanzwesen bei weitem nicht nur national und nicht nur von den klassischen Regulierern vorgegeben werden. Zur Bewältigung dieser komplexen Anforderungen und ihrer Automatisierung werden KI-Lösungen immer mehr erforderlich sein.
Kurzum, Unternehmen bzw. Mandanten sollten die Transformation der Wirtschaftsprüfung positiv begleiten. Für die Wirtschaftsprüfung selbst ist die Transformation ernster zu nehmen, als lediglich über ChatGPT-Ergebnisse zu diskutieren. Die vollautomatische Abschlussprüfung ist noch eine Vision, aber für kleinere Prüfungen in Zukunft mit KI nicht undenkbar. Der Aufbau von Enterprise-Lösungen unter Einsatz des enorm großen geistigen Eigentums, das unbestritten in den WPG vorliegt, ist sicherlich ein Schlüssel zum Erfolg.
Prof. Dr. Rüdiger
Loitz
, WP/StB/CPA, leitet als Partner der PricewaterhouseCoopers GmbH WPG in Düsseldorf die Kapitalmarkt- und Rechnungslegungsberatung von PwC, ist Mitglied und Chief Operating Officer (COO) der Assurance Practice und gibt in dem Beitrag seine persönliche Meinung wieder. Zudem ist er Honorarprofessor der betriebswirtschaftlichen Fakultät der Universität zu Köln.
Loitz, BB 2024, Heft 36, Umschlagteil, I