KI in der Praxis

Der große Kompetenzausgleich: GPT-4 für Unternehmensberater

Matthias Bastian

Midjourney prompted by THE DECODER

Laut einer Studie steht die Beratungsbranche dank großer KI-Modelle wie GPT-4 vor einem Umbruch.

Die Studie wurde von der Boston Consulting Group in Zusammenarbeit mit Forschern der Harvard Business School, des MIT Sloan, der Warwick Business School und der Wharton School durchgeführt. Sie untersuchte die Arbeit von 758 zufällig ausgewählten Beratern der Boston Consulting Group.

Einige der Berater durften GPT-4 verwenden, während andere ohne KI arbeiteten. Die KI-Berater hatten über eine API Zugang zum allgemein verfügbaren GPT-4 ohne spezielle Prompts oder Feintuning.

Der große Kompetenzausgleich

Das Team verglich 18 typische Aufgaben aus der Beratungspraxis für ein fiktives Schuhunternehmen: Pressetexte schreiben, Marktanalysen durchführen, kreative Ideen für neue Produkte entwickeln, inspirierende Reden schreiben und so weiter.

Die Ergebnisse, von Menschen und GPT-4 bewertet, waren identisch. Beraterinnen und Berater, die mit GPT-4 arbeiteten, erledigten im Schnitt 12,2 Prozent mehr Aufgaben, agierten 25,1 Prozent schneller und erzielten 40 Prozent bessere Ergebnisse als ihre Kolleginnen und Kollegen ohne KI.

"Die Beraterinnen und Berater, die ChatGPT-4 nutzten, übertrafen diejenigen, die dies nicht taten, um ein Vielfaches. In jeder Dimension", schreibt Ethan Mollick von der Wharton School, der an der Studie beteiligt war.

Verteilung der Ausgabequalität über alle Aufgaben. Die blaue Gruppe verwendete keine KI, die grüne und die rote Gruppe verwendeten KI, wobei die rote Gruppe eine zusätzliche Schulung zur Verwendung von KI erhielt. | Bild: Dell'Acqua et al.

Die Studie zeigte auch, dass insbesondere Berater, die ohne KI unterdurchschnittliche Ergebnisse erzielten, vom Einsatz von KI profitierten. Mit KI erzielten sie eine Leistungssteigerung von 43 Prozent, während sich die leistungsstarken Berater um 17 Prozent verbesserten. Diese Fähigkeit, Kompetenzen auszugleichen, werde immer noch unterschätzt, vermutet Mollick.

Bild: Dell'Acqua et al.

Darüber hinaus identifizierte das Forschungsteam zwei Nutzungsmuster: Berater, die einzelne Aufgaben an die KI auslagerten ("Zentauren"), und Berater, die die KI vollständig in ihren Arbeitsablauf integrierten ("Cyborgs"). Beide profitierten vom KI-Einsatz.

Die Zick-Zack-Grenze der KI

Die Studie zeigt aber auch, dass generative KI zwar bei vielen Aufgaben hervorragend funktioniert, bei bestimmten Problemen aber versagt. Dieses Problem bezeichnen die Forscher als "Zickzack-Grenze" der KI-Fähigkeiten.

Bei Aufgaben außerhalb dieses Bereichs schnitten die Berater um fast 25 Prozent schlechter ab als Berater ohne KI, weil das Werkzeug unzuverlässige oder falsche Informationen lieferte. Die Forscher warnen daher davor, KI im Blindflug einzusetzen.

"Bei manchen Aufgaben ist KI sehr gut, bei anderen versagt sie ganz oder auf subtile Weise. Und wenn man KI nicht häufig einsetzt, weiß man nicht, was was ist", schreibt Mollick.

Bild: Dell'Acqua et al.

Insgesamt sei es den meisten Beratern jedoch gelungen, souverän im Grenzbereich zu navigieren und die positiven Aspekte der KI für ihre Arbeit zu nutzen, ohne sich von den negativen Auswirkungen beeinträchtigen zu lassen.

Mollick erwartet, dass die derzeitigen Grenzen der KI ständig erweitert werden und dass sich ihre Fähigkeiten in Zukunft weiterentwickeln und verbessern werden. Mindestens zwei Unternehmen werden im nächsten Jahr Modelle auf den Markt bringen, die leistungsfähiger sind als GPT-4, so Mollick.