Anthropic veröffentlicht seinen Bauplan für den kürzlich veröffentlichten Claude-Research-Agenten.
Das System basiert auf einer Multi-Agenten-Architektur: Ein Hauptagent analysiert Nutzeranfragen, entwickelt eine Strategie und startet mehrere spezialisierte Subagenten, die parallel Informationen suchen. Dadurch lassen sich komplexe Recherchen schneller und gründlicher bearbeiten als mit Einzelagenten.

Laut Anthropic übertreffen diese Systeme einen reinen Claude Opus 4-Agenten in internen Tests um 90,2 Prozent. Die Architektur nutzt Claude Opus 4 als Koordinator und Claude Sonnet 4 als Subagenten.
Anthropic verlässt sich bei der Bewertung seiner Agenten auf ein LLM als Richter, das die Ausgaben nach Kriterien wie Faktengenauigkeit, Quellenqualität und Werkzeugnutzung bewertet. Diese Methode habe sich als zuverlässiger und effizienter als klassische Bewertungssysteme erwiesen. Das ist ein klarer Push für LLMs als Meta-Werkzeuge.
Die Firma hebt zudem hervor, dass Claude 4 dazu in der Lage ist, eigene Fehler zu erkennen, Werkzeugbeschreibungen zu überarbeiten und auf diese Weise die eigene Leistung zu verbessern. Die Entwickler beschreiben das Modell als eine Art "Prompt Engineer" in eigener Sache.
Laut Anthropic ist der hohe Tokenverbrauch – etwa 15-mal höher als bei gewöhnlichen Chats – ein zentraler Faktor für die Leistungsfähigkeit von Multi-Agenten-Systemen. In internen Tests erklärte allein die Anzahl der verwendeten Token rund 80 Prozent der Leistungsunterschiede, ergänzt durch die Anzahl der genutzten Werkzeuge und die Wahl des Modells.
Ein Upgrade auf Claude Sonnet 4 brachte dabei einen größeren Leistungsgewinn als die bloße Verdopplung des Tokenbudgets bei Claude Sonnet 3.7. Damit zeigt sich: Tokenverbrauch ist wichtig – Modellwahl und Tool-Nutzung bleiben aber ebenfalls entscheidend.
Geeignet sind solche Systeme laut Anthropic primär für Aufgaben mit hohem Informationsbedarf und paralleler Bearbeitung.
Asynchrone Ausführung als nächster Schritt für agentischere KI
Für die Zukunft sei eine asynchrone Ausführung das Ziel, bei der Agenten, falls nötig, eigenständig weitere Subagenten erstellen und parallel arbeiten können. Derzeit blockiert jedoch das synchrone Modell den Informationsfluss: Der Hauptagent muss warten, bis alle Subagenten ihre Aufgaben abgeschlossen haben.
Eine Umstellung auf Asynchronität würde zwar mehr Flexibilität und Geschwindigkeit bringen, erfordert jedoch komplexe Koordination, konsistente Zustandsverwaltung und robuste Fehlerbehandlung – Herausforderungen, die laut Anthropic bisher noch nicht zufriedenstellend gelöst sind.