Inhalt
summary Zusammenfassung

Anthropic veröffentlicht seinen Bauplan für den kürzlich veröffentlichten Claude-Research-Agenten.

Anzeige

Das System basiert auf einer Multi-Agenten-Architektur: Ein Hauptagent analysiert Nutzeranfragen, entwickelt eine Strategie und startet mehrere spezialisierte Subagenten, die parallel Informationen suchen. Dadurch lassen sich komplexe Recherchen schneller und gründlicher bearbeiten als mit Einzelagenten.

High-level-Architekturdiagramm von Claudes Multi-Agent-Forschungssystem mit Lead-Agent, Such- und Zitations-Subagenten.
Die Architektur von Claudes Research-Funktion. Ein Lead-Agent (Orchestrator) steuert spezialisierte Such- und Zitations-Subagenten und nutzt ein Memory-Modul, um aus Nutzeranfragen umfassende Berichte zu generieren. | Bild: Anthropic

Laut Anthropic übertreffen diese Systeme einen reinen Claude Opus 4-Agenten in internen Tests um 90,2 Prozent. Die Architektur nutzt Claude Opus 4 als Koordinator und Claude Sonnet 4 als Subagenten.

Anthropic verlässt sich bei der Bewertung seiner Agenten auf ein LLM als Richter, das die Ausgaben nach Kriterien wie Faktengenauigkeit, Quellenqualität und Werkzeugnutzung bewertet. Diese Methode habe sich als zuverlässiger und effizienter als klassische Bewertungssysteme erwiesen. Das ist ein klarer Push für LLMs als Meta-Werkzeuge.

Anzeige
Anzeige

Die Firma hebt zudem hervor, dass Claude 4 dazu in der Lage ist, eigene Fehler zu erkennen, Werkzeugbeschreibungen zu überarbeiten und auf diese Weise die eigene Leistung zu verbessern. Die Entwickler beschreiben das Modell als eine Art "Prompt Engineer" in eigener Sache.

Laut Anthropic ist der hohe Tokenverbrauch – etwa 15-mal höher als bei gewöhnlichen Chats – ein zentraler Faktor für die Leistungsfähigkeit von Multi-Agenten-Systemen. In internen Tests erklärte allein die Anzahl der verwendeten Token rund 80 Prozent der Leistungsunterschiede, ergänzt durch die Anzahl der genutzten Werkzeuge und die Wahl des Modells.

Ein Upgrade auf Claude Sonnet 4 brachte dabei einen größeren Leistungsgewinn als die bloße Verdopplung des Tokenbudgets bei Claude Sonnet 3.7. Damit zeigt sich: Tokenverbrauch ist wichtig – Modellwahl und Tool-Nutzung bleiben aber ebenfalls entscheidend.

Geeignet sind solche Systeme laut Anthropic primär für Aufgaben mit hohem Informationsbedarf und paralleler Bearbeitung.

Asynchrone Ausführung als nächster Schritt für agentischere KI

Für die Zukunft sei eine asynchrone Ausführung das Ziel, bei der Agenten, falls nötig, eigenständig weitere Subagenten erstellen und parallel arbeiten können. Derzeit blockiert jedoch das synchrone Modell den Informationsfluss: Der Hauptagent muss warten, bis alle Subagenten ihre Aufgaben abgeschlossen haben.

Empfehlung

Eine Umstellung auf Asynchronität würde zwar mehr Flexibilität und Geschwindigkeit bringen, erfordert jedoch komplexe Koordination, konsistente Zustandsverwaltung und robuste Fehlerbehandlung – Herausforderungen, die laut Anthropic bisher noch nicht zufriedenstellend gelöst sind.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Anthropic hat den Bauplan seines neuen Research-Agenten veröffentlicht, der auf einer Multi-Agenten-Architektur basiert: Ein Hauptagent analysiert Anfragen, entwickelt Strategien und startet spezialisierte Subagenten, um komplexe Recherchen parallel und gründlicher zu bearbeiten.
  • Interne Tests zeigen laut Anthropic, dass diese Architektur einen einzelnen Claude Opus 4-Agenten um 90,2 Prozent übertrifft; dabei werden Claude Opus 4 als Koordinator und Claude Sonnet 4 als Subagenten eingesetzt.
  • Laut Anthropic ist der hohe Tokenverbrauch – etwa 15-mal höher als bei gewöhnlichen Chats – ein zentraler Faktor für die Leistungsfähigkeit von Multi-Agenten-Systemen. Modellwahl und Tool-Nutzung bleiben aber ebenfalls entscheidend.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!