Anzeige
Skip to content

Anthropic halbiert KI-Produktivitätsprognosen für US-Wirtschaft nach Analyse von Claudes Fehlerquoten

Image description
Nano Banana Pro prompted by THE DECODER

Anthropic analysiert erstmals systematisch, wie oft Claude bei Aufgaben scheitert. Die Daten zeigen: Je komplexer die Arbeit, desto geringer die Erfolgsquote. Das Unternehmen korrigiert seine Produktivitätsprognosen deutlich nach unten.

Der KI-Entwickler Anthropic hat seinen vierten "Economic Index Report" veröffentlicht, der erstmals systematisch erfasst, wie erfolgreich Claude bei verschiedenen Aufgaben ist. Die Analyse basiert auf einer Million Claude.ai-Gesprächen und einer Million API-Transkripten aus dem November 2025, kurz vor der Veröffentlichung von Opus 4.5.

Kern des Berichts sind fünf neue "economic primitives" - grundlegende Messgrößen, die Anthropic durch Befragung von Claude über anonymisierte Transkripte gewinnt. Diese erfassen die Aufgabenkomplexität (wie lange ein Mensch ohne KI benötigen würde), das erforderliche Bildungsniveau für Eingaben und Antworten, den Anwendungsfall (Arbeit, Studium oder persönlich), den Autonomiegrad der KI sowie den Aufgabenerfolg.

Erfolgsrate sinkt bei komplexen Aufgaben deutlich

Die Daten zeigen einen klaren Zielkonflikt: Komplexere Aufgaben bringen zwar größere Zeitersparnis, aber Claude scheitert häufiger daran. Laut dem Bericht erreicht Claude bei API-Anfragen eine Erfolgsrate von etwa 60 Prozent für Aufgaben unter einer Stunde, die auf etwa 45 Prozent für Aufgaben über fünf Stunden fällt. Die 50-Prozent-Schwelle liegt bei geschätzten 3,5 Stunden Arbeitszeit.

Anzeige
DEC_D_Incontent-1

Bei Claude.ai sieht das Bild anders aus: Dort sinkt die Erfolgsrate deutlich langsamer mit zunehmender Aufgabenlänge. Anthropic schätzt, dass Claude.ai erst bei etwa 19 Stunden die 50-Prozent-Marke unterschreiten würde. Der Unterschied liegt laut den Forschern am Multi-Turn-Charakter der Gespräche, bei denen Nutzer Kurs korrigieren und iterieren können.

Produktivitätsschätzungen fallen um die Hälfte

Die neuen Erfolgsraten-Daten zwingen Anthropic zu einer Korrektur früherer Prognosen. In einer vorherigen Analyse hatte das Unternehmen geschätzt, dass breite KI-Adoption das jährliche Arbeitsproduktivitätswachstum in den USA um 1,8 Prozentpunkte steigern könnte. Mit den Erfolgsraten-Anpassungen fällt diese Schätzung auf etwa 1,0 bis 1,2 Prozentpunkte.

Berücksichtigt man zusätzlich sogenannte Bottleneck-Effekte - also Aufgaben, die für einen Job essenziell sind, aber von KI nicht beschleunigt werden können –, sinkt der geschätzte Effekt auf 0,6 bis 0,8 Prozentpunkte. Dennoch betont Anthropic, dass selbst ein Prozentpunkt jährlich über zehn Jahre das US-Produktivitätswachstum auf das Niveau der späten 1990er und frühen 2000er Jahre zurückbringen würde. Dazu erwartet das Unternehmen in Zukunft weiter leistungsfähigere Modelle mit höheren Erfolgsraten.

KI-Nutzung könnte Berufe "deskilllen"

Ein zentraler Befund des Berichts betrifft die Auswirkungen auf Berufsprofile. Claude wird laut den Daten tendenziell für Aufgaben genutzt, die höhere Bildung erfordern - der Durchschnitt liegt bei 14,4 Jahren (entspricht einem Associate's Degree), verglichen mit 13,2 Jahren für alle Aufgaben in der US-Wirtschaft.

Anzeige
DEC_D_Incontent-2

Wenn diese KI-unterstützten Aufgaben wegfallen, bleibt für Menschen weniger qualifizierte Arbeit übrig - ein Netto-"Deskilling"-Effekt. Anthropic nennt konkrete Beispiele: Reisebüromitarbeiter würden Planungsaufgaben an KI verlieren und hauptsächlich Tickets ausstellen und Zahlungen einziehen. Immobilienverwalter hingegen würden ein "Upskilling" erleben, da Buchhaltungsaufgaben wegfallen und Vertragsverhandlungen und Stakeholder-Management bleiben.

Anspruchsvolle Prompts führen zu anspruchsvollen Antworten

Die Analyse offenbart auch einen engen Zusammenhang zwischen dem Bildungsniveau der Nutzereingaben und der Qualität der Claude-Antworten. Anthropic misst beide Seiten: Wie viele Jahre formaler Bildung nötig sind, um einen Nutzer-Prompt zu verstehen, und wie viele Jahre nötig sind, um Claudes Antwort zu verstehen. Der Korrelationskoeffizient zwischen beiden Werten liegt bei über 0,92 - sowohl auf Länderebene als auch zwischen US-Bundesstaaten.

Das bedeutet konkret: Nutzer, die komplexe, fachlich präzise Anfragen formulieren, erhalten entsprechend anspruchsvolle Antworten. Wer hingegen einfache Fragen stellt, bekommt einfache Antworten. Claude passt sein Antwortniveau dynamisch an das Eingabeniveau an. Dies hat laut Anthropic weitreichende Implikationen: Länder mit höherem Bildungsniveau könnten unabhängig von der reinen Adoptionsrate stärker von KI profitieren, weil ihre Bevölkerung in der Lage ist, das Potenzial der Modelle durch qualifizierte Prompts besser auszuschöpfen.

Nutzer arbeiten wieder mehr mit Claude zusammen statt Aufgaben zu delegieren

Seit dem letzten Bericht im August 2025 hat sich das Nutzungsverhalten auf Claude.ai verschoben. Anthropic unterscheidet grundsätzlich zwischen zwei Nutzungsarten: Bei der "Augmentation" arbeiten Nutzer kollaborativ mit Claude - sie iterieren gemeinsam an Aufgaben, lassen sich Konzepte erklären oder holen Feedback ein. Bei der "Automation" hingegen delegieren Nutzer eine Aufgabe vollständig an Claude, das diese mit minimalem Hin und Her erledigt.

Im August 2025 hatte die automatisierte Nutzung erstmals die augmentierte überholt - ein Zeichen dafür, dass Nutzer zunehmend bereit waren, Aufgaben komplett an Claude abzugeben. Dieser Trend hat sich nun umgekehrt: Der Anteil augmentierter Nutzung stieg auf 52 Prozent, während die automatisierte Nutzung auf 45 Prozent fiel. Besonders der Anteil sogenannter "direktiver" Gespräche - bei denen Nutzer Claude eine Aufgabe geben und diese ohne Rückfragen erledigt wird - sank von 39 auf 32 Prozent.

Anthropic vermutet, dass Produktneuerungen wie Dateierstellung, persistenter Speicher und anpassbare "Skills" zu mehr kollaborativen Interaktionen geführt haben. Diese Funktionen ermöglichen komplexere Workflows, bei denen Nutzer stärker eingebunden bleiben. Mit agentenbasierter Nutzung, bei der KI-Systeme eigenständig mehrstufige Aufgaben ausführen, hat diese Unterscheidung nur bedingt zu tun: Agenten würden eher in die Kategorie Automation fallen, sind aber in den analysierten Daten nicht separat ausgewiesen.

Die Nutzung bleibt dabei hochkonzentriert: Die zehn häufigsten Aufgaben machen 24 Prozent aller Claude.ai-Gespräche aus. Code- und mathematische Aufgaben dominieren weiterhin mit 34 Prozent auf Claude.ai und 46 Prozent bei API-Nutzung.

Schnelle Konvergenz in den USA, globale Ungleichheit bleibt

Innerhalb der USA zeigen sich erste Anzeichen einer schnellen regionalen Angleichung: Bundesstaaten mit niedrigerer Nutzung holen relativ schneller auf. Anthropic schätzt, dass die Nutzung pro Kopf in zwei bis fünf Jahren angeglichen sein könnte - etwa zehnmal schneller als die Diffusion wirtschaftlich bedeutsamer Technologien im 20. Jahrhundert.

Global hingegen zeigt sich keine Konvergenz. Die USA, Indien, Japan, Großbritannien und Südkorea führen bei der Claude.ai-Nutzung, und die Ungleichheit korreliert weiterhin stark mit dem BIP pro Kopf - ein Prozent Anstieg korreliert mit 0,7 Prozent mehr Claude-Nutzung. In Ländern mit niedrigerem Pro‑Kopf‑Einkommen sind Coursework-/Bildungs‑Use‑Cases relativ häufiger, während Claude insgesamt überwiegend für Arbeit genutzt wird.

Anthropic veröffentlicht die Daten auf Hugging Face, um externen Forschern die Untersuchung der wirtschaftlichen Auswirkungen von KI zu ermöglichen. Hier gibt es den vollständigen Bericht.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren