Anthropic zeigt seinen Bauplan für einen KI-Research-Agenten mit parallelen Subagenten
Kurz & Knapp
- Anthropic hat den Bauplan seines neuen Research-Agenten veröffentlicht, der auf einer Multi-Agenten-Architektur basiert: Ein Hauptagent analysiert Anfragen, entwickelt Strategien und startet spezialisierte Subagenten, um komplexe Recherchen parallel und gründlicher zu bearbeiten.
- Interne Tests zeigen laut Anthropic, dass diese Architektur einen einzelnen Claude Opus 4-Agenten um 90,2 Prozent übertrifft; dabei werden Claude Opus 4 als Koordinator und Claude Sonnet 4 als Subagenten eingesetzt.
- Laut Anthropic ist der hohe Tokenverbrauch – etwa 15-mal höher als bei gewöhnlichen Chats – ein zentraler Faktor für die Leistungsfähigkeit von Multi-Agenten-Systemen. Modellwahl und Tool-Nutzung bleiben aber ebenfalls entscheidend.
Anthropic veröffentlicht seinen Bauplan für den kürzlich veröffentlichten Claude-Research-Agenten.
Das System basiert auf einer Multi-Agenten-Architektur: Ein Hauptagent analysiert Nutzeranfragen, entwickelt eine Strategie und startet mehrere spezialisierte Subagenten, die parallel Informationen suchen. Dadurch lassen sich komplexe Recherchen schneller und gründlicher bearbeiten als mit Einzelagenten.

Laut Anthropic übertreffen diese Systeme einen reinen Claude Opus 4-Agenten in internen Tests um 90,2 Prozent. Die Architektur nutzt Claude Opus 4 als Koordinator und Claude Sonnet 4 als Subagenten.
Anthropic verlässt sich bei der Bewertung seiner Agenten auf ein LLM als Richter, das die Ausgaben nach Kriterien wie Faktengenauigkeit, Quellenqualität und Werkzeugnutzung bewertet. Diese Methode habe sich als zuverlässiger und effizienter als klassische Bewertungssysteme erwiesen. Das ist ein klarer Push für LLMs als Meta-Werkzeuge.
Die Firma hebt zudem hervor, dass Claude 4 dazu in der Lage ist, eigene Fehler zu erkennen, Werkzeugbeschreibungen zu überarbeiten und auf diese Weise die eigene Leistung zu verbessern. Die Entwickler beschreiben das Modell als eine Art "Prompt Engineer" in eigener Sache.
Laut Anthropic ist der hohe Tokenverbrauch – etwa 15-mal höher als bei gewöhnlichen Chats – ein zentraler Faktor für die Leistungsfähigkeit von Multi-Agenten-Systemen. In internen Tests erklärte allein die Anzahl der verwendeten Token rund 80 Prozent der Leistungsunterschiede, ergänzt durch die Anzahl der genutzten Werkzeuge und die Wahl des Modells.
Ein Upgrade auf Claude Sonnet 4 brachte dabei einen größeren Leistungsgewinn als die bloße Verdopplung des Tokenbudgets bei Claude Sonnet 3.7. Damit zeigt sich: Tokenverbrauch ist wichtig – Modellwahl und Tool-Nutzung bleiben aber ebenfalls entscheidend.
Geeignet sind solche Systeme laut Anthropic primär für Aufgaben mit hohem Informationsbedarf und paralleler Bearbeitung.
Asynchrone Ausführung als nächster Schritt für agentischere KI
Für die Zukunft sei eine asynchrone Ausführung das Ziel, bei der Agenten, falls nötig, eigenständig weitere Subagenten erstellen und parallel arbeiten können. Derzeit blockiert jedoch das synchrone Modell den Informationsfluss: Der Hauptagent muss warten, bis alle Subagenten ihre Aufgaben abgeschlossen haben.
Eine Umstellung auf Asynchronität würde zwar mehr Flexibilität und Geschwindigkeit bringen, erfordert jedoch komplexe Koordination, konsistente Zustandsverwaltung und robuste Fehlerbehandlung – Herausforderungen, die laut Anthropic bisher noch nicht zufriedenstellend gelöst sind.
KI-News ohne Hype
Von Menschen kuratiert.
- Mehr als 20 Prozent Launch-Rabatt.
- Lesen ohne Ablenkung – keine Google-Werbebanner.
- Zugang zum Kommentarsystem und Austausch mit der Community.
- Wöchentlicher KI-Newsletter.
- 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
- Bis zu 25 % Rabatt auf KI Pro Online-Events.
- Zugang zum kompletten Archiv der letzten zehn Jahre.
- Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.