KI-Entwickler Andrej Karpathy revidiert Meinung zu KI-Agenten: Von "funktionieren nicht" zu 80 Prozent KI-Coding in nur drei Monaten
Kurz & Knapp
- Der KI-Forscher Andrej Karpathy hat seine Arbeitsweise innerhalb weniger Wochen umgestellt: Im November programmierte er noch 80 Prozent manuell, im Dezember überließ er 80 Prozent der Arbeit KI-Agenten.
- Er spricht von der größten Veränderung seines Coding-Workflows in zwei Jahrzehnten. Noch im Oktober 2025 hatte Karpathy KI-Agenten als unzureichend bezeichnet.
- Trotz der Vorteile warnt Karpathy vor Schwächen der Modelle: Sie machten subtile konzeptuelle Fehler wie "schlampige Junior-Entwickler", träfen falsche Annahmen, fragten nicht nach und neigten zur Überkomplikation.
Der bekannte KI-Entwickler Andrej Karpathy, der noch im Oktober über KI-Agenten sagte, dass sie "einfach nicht funktionieren", hat seine Meinung geändert.
Der frühere OpenAI- und Tesla-KI-Forscher Andrej Karpathy berichtet in einem ausführlichen Post auf X von einem fundamentalen Wandel in seiner Arbeitsweise. Innerhalb weniger Wochen sei er von 80 Prozent manuellem Coding und 20 Prozent Agenten-Nutzung im November auf das genaue Gegenteil im Dezember gewechselt: 80 Prozent Agent, 20 Prozent manuelle Edits.
"Ich programmiere jetzt wirklich hauptsächlich in Englisch, sage dem LLM etwas verschämt, welchen Code es schreiben soll … in Worten", schreibt Karpathy. Das verletze zwar das Ego, doch die Fähigkeit, Software in großen "Code-Aktionen" zu bearbeiten, sei einfach zu nützlich.
Für Karpathy handelt es sich um die größte Veränderung seines Coding-Workflows in rund zwei Jahrzehnten Programmierarbeit. Er vermutet, dass Ähnliches derzeit bei einem zweistelligen Prozentsatz der Ingenieure passiere, während das Bewusstsein dafür in der Allgemeinbevölkerung im niedrigen einstelligen Bereich liege.
Modelle machen Fehler wie "schlampige Junior-Entwickler"
Trotz seiner Begeisterung warnt Karpathy vor überzogenen Erwartungen. Die Modelle machten nach wie vor Fehler, und wer Code habe, der ihm wichtig sei, solle die Agenten "wie ein Falke beobachten".
Die Art der Fehler habe sich allerdings verändert: Es seien keine einfachen Syntaxfehler mehr, sondern subtile konzeptuelle Fehler, wie sie ein "etwas schlampiger, hastiger Junior-Entwickler" machen würde.
Karpathy listet konkrete Schwächen auf: Die Modelle treffen falsche Annahmen und arbeiten damit weiter, ohne nachzufragen. Sie managen ihre Verwirrung nicht, suchen keine Klärung, zeigen Inkonsistenzen nicht auf, präsentieren keine Trade-offs und widersprechen nicht, wenn sie sollten. Außerdem seien sie immer noch "etwas zu sycophantisch".
Besonders kritisch sieht er die Tendenz zur Überkomplikation: Die Modelle blähen Abstraktionen auf, räumen toten Code nicht auf und implementieren ineffiziente Konstruktionen über 1000 Zeilen, die sich auf 100 reduzieren ließen, sobald man nachfragt.
2026 als Jahr der "Slopacolypse"
Für 2026 erwartet Karpathy daher eine "Slopacolypse" auf GitHub, Substack, arXiv, X, Instagram und generell allen digitalen Medien, also massenhaft "fast richtigen"-Code, der in Teilen funktioniert, aber generell eine niedrige Qualität hat. Neben echten Verbesserungen werde es zudem weiter "KI-Hype-Produktivitätstheater" geben.
Dennoch bezeichnet Karpathy die Entwicklung als "netto riesige Verbesserung". Es sei sehr schwierig, sich vorzustellen, zum manuellen Coding zurückzukehren. Besonders beeindruckt zeigt er sich von der Ausdauer der Agenten, die nie müde oder demoralisiert würden und einfach weiter Dinge ausprobierten, wo ein Mensch längst aufgegeben hätte.
Der Haupteffekt für ihn persönlich sei nicht schnelleres Arbeiten, sondern mehr Dinge tun zu können: Er könne nun Projekte umsetzen, die sich vorher nicht gelohnt hätten, und an Code arbeiten, der wegen Wissenslücken nicht möglich gewesen wäre.
Gleichzeitig warnt er: LLM-Coding werde Ingenieure spalten – zwischen denen, die primär das Coding mochten, und denen, die primär die architektonische Arbeit mochten. Seine Fähigkeit, Code manuell zu schreiben, verkümmere langsam. Generation und Diskrimination seien verschiedene Fähigkeiten im Gehirn: Wer Code gut reviewen könne, habe deshalb noch lange keine Routine darin, ihn selbst zu schreiben.
Karpathys frühere Skepsis
Das Fazit des Ex-Tesla-KI-Chefs: Die Fähigkeiten von LLM-Agenten, insbesondere Claude und Codex, hätten im Dezember 2025 eine Art Schwelle der Kohärenz überschritten und einen Phasenwechsel im Software-Engineering ausgelöst. Der Intelligenz-Teil fühle sich plötzlich deutlich weiter an als alles andere: Integrationen, Tools, Wissen, neue organisatorische Arbeitsabläufe und Prozesse. 2026 werde ein "energiereiches Jahr" für die Industrie, prognostiziert Karpathy.
Noch im Oktober 2025 hatte Karpathy eine gänzlich andere Position vertreten. Damals sagte er im Gespräch mit Podcaster Dwarkesh Patel, man solle nicht von einem "Jahr der Agenten", sondern realistischer von einem "Jahrzehnt der Agenten" sprechen.
Die Defizite agentischer KI-Systeme beschrieb er als tiefgreifend: Die Modelle seien kognitiv unzureichend, nicht multimodal genug, verfügten über kein funktionierendes Gedächtnis und könnten komplexe Computeraufgaben nicht zuverlässig ausführen. Sein damaliges Fazit: "Sie funktionieren einfach nicht."
Dass er diese Einschätzung nun so grundlegend revidiert, unterstreicht die Geschwindigkeit der Entwicklung in den vergangenen Monaten.
Zuletzt sagte auch ein OpenAI-KI-Entwickler, dass er keinen Code mehr manuell schreibe. Er erwarte, dass Unternehmen bald ihren eigenen Code nicht mehr verstünden, daraus resultierende gravierende Fehler aber dennoch gelöst werden könnten. Auch eine Google-Ingenieurin sprach von enormen Zugewinnen durch agentisches KI-Coding.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnieren