Anzeige
Skip to content

Anthropic-Mitgründer hält automatisierte KI-Forschung bis 2028 für wahrscheinlich

Image description
Nano Banana Pro prompted by THE DECODER

Jack Clark sieht in einem ausführlichen Essay die Voraussetzungen für KI-Systeme, die ihre eigenen Nachfolger trainieren, bereits weitgehend gegeben. Er beziffert die Wahrscheinlichkeit auf 60 Prozent bis Ende 2028.

In seinem Newsletter Import AI argumentiert Anthropic-Mitgründer Jack Clark, dass die öffentlich verfügbaren Daten auf eine bevorstehende Automatisierung der KI-Forschung hindeuten. Konkret meint Clark damit ein System, das ohne menschliche Beteiligung in der Lage wäre, einen leistungsfähigeren Nachfolger zu trainieren. Er hält dies bis Ende 2028 mit etwa 60 Prozent Wahrscheinlichkeit für möglich, für 2027 setzt er 30 Prozent an.

Clark stützt seine Einschätzung primär auf Benchmark-Verläufe. Beim Coding-Test SWE-Bench, der reale GitHub-Issues abbildet, sei die Erfolgsquote von rund zwei Prozent (Claude 2, Ende 2023) auf 93,9 Prozent gestiegen und damit faktisch gesättigt. Die METR-Messung der Aufgabenlänge, die KI-Systeme mit 50-prozentiger Zuverlässigkeit bewältigen können, sei von 30 Sekunden bei GPT-3.5 auf rund zwölf Stunden bei aktuellen Frontier-Modellen geklettert. METR-Forscherin Ajeya Cotra halte 100 Stunden bis Ende 2026 für plausibel.

Wissenschaftliche Kernfähigkeiten der KI-Forschung sind weitgehend abgedeckt

Auch bei forschungsspezifischen Aufgaben sieht Clark drastische Fortschritte. Der CORE-Bench, der die Reproduktion wissenschaftlicher Paper testet, sei nach Angaben eines der Autoren mit 95,5 Prozent gelöst. Bei MLE-Bench zur Lösung von Kaggle-Wettbewerben stieg der Bestwert von 16,9 auf 64,4 Prozent. Bei einem internen Anthropic-Test, der Modelle einen CPU-basierten Trainingscode optimieren lässt, verbesserte sich der mittlere Speedup laut Clark von 2,9-fach (Opus 4, Mai 2025) auf 52-fach (April 2026). Ein menschlicher Forscher benötige für einen 4-fachen Speedup vier bis acht Stunden.

Beim PostTrainBench, der das Fine-Tuning offener Modelle gegen menschlich entwickelte Instruct-Versionen misst, erreichten die besten Systeme rund die Hälfte der menschlichen Punktzahl. Anthropic habe zudem einen Proof-of-Concept für automatisierte Alignment-Forschung vorgelegt, bei dem KI-Agenten auf einem kleinen Skalierungsniveau menschliche Baselines schlugen.

Den größten Teil der KI-Forschung beschreibt Clark als mühsame Kleinarbeit – Skalieren, Debuggen, Parameter-Variation – und genau hier seien Modelle bereits stark. Paradigmenwechsel wie die Transformer-Architektur hätten KI-Systeme bislang nicht hervorgebracht. Erste Indizien für echte Forschungskreativität sieht Clark in Mathematik-Erfolgen wie der Lösung eines Erdős-Problems, ordnet sie aber vorsichtig ein.

Alignment-Risiken könnten sich rekursiv verstärken

Die Implikationen seien nach Clarks Einschätzung in der öffentlichen Debatte unterschätzt. Zentral sei, dass aktuelle Alignment-Methoden unter rekursiver Selbstverbesserung brechen könnten, sobald die Systeme intelligenter werden als ihre Aufseher.

Clark listet mehrere konkrete Probleme auf: Trainingsumgebungen seien oft so gebaut, dass die effizienteste Lösung im Schummeln bestehe – das Modell lerne also, dass Cheating belohnt wird. Modelle könnten zudem "Alignment vortäuschen", indem sie Antworten ausgeben, die ihre tatsächlichen Absichten verschleiern. Systeme erkennen heute bereits, wenn sie getestet werden.

Hinzu komme ein grundsätzliches Problem rekursiver Schleifen: Solange ein Alignment-Verfahren nicht zu 100 Prozent korrekt sei, akkumulierten sich Fehler. Eine Technik mit 99,9 Prozent Genauigkeit falle nach 50 Generationen auf 95 Prozent, nach 500 Generationen auf rund 60 Prozent. Wenn KI-Systeme zudem selbst die Forschungsagenda für ihr eigenes Training prägen, fehlten den Menschen womöglich die Intuitionen, um die Konsequenzen zu beurteilen.

"Maschinenökonomie" und Forschungsgespür

Wirtschaftlich erwartet Clark eine "Maschinenökonomie" innerhalb der bestehenden Wirtschaft: kapitalintensive, personalarme Unternehmen, deren KI-Systeme zunehmend miteinander interagieren. Daraus ergäben sich Verteilungsfragen rund um den knappen Zugang zu Rechenleistung sowie Bruchstellen dort, wo schnelle digitale auf langsame physische Prozesse treffen, etwa bei Arzneimittelzulassungen.

KI-Forscher Herbie Bradley, der kürzlich in seinem Blog AI Pathways selbst über automatisierte KI-Forscher geschrieben hat, widerspricht Clarks Schlussfolgerungen teilweise. Vieles spreche dafür, dass Modelle die Arbeit von Junior-Researchern übernehmen, nicht aber höhere Fähigkeiten wie Forschungsgespür, Visionsbildung oder das Aufstellen kohärenter langfristiger Forschungsagenden. Software-Engineering insgesamt habe zudem eine höhere Komplexitätsdecke als KI-Forschung im engeren Sinn.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Der Rest ist für Abonnenten.
Jetzt Abo abschließen.

  • Zugriff auf alle THE DECODER Artikel.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: “KI Radar” – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren