Anzeige
Skip to content

Neue Stanford-Studie klärt, wann sich mehrere KI-Agenten auszahlen

Image description
Nano Banana Pro prompted by THE DECODER

Mehrere KI-Agenten, die zusammenarbeiten, gelten als leistungsfähiger. Eine Stanford-Studie zeigt: Der vermeintliche Vorteil liegt vor allem daran, dass die Teams mehr Rechenleistung verbrauchen.  Doch es gibt wichtige Ausnahmen.

In der KI-Forschung setzen viele Entwickler auf sogenannte Multi-Agenten-Systeme: Mehrere KI-Modelle teilen sich eine Aufgabe, diskutieren oder prüfen gegenseitig ihre Ergebnisse. Das soll zu besseren Antworten führen, etwa bei komplexen Fragen, die mehrere Denkschritte erfordern.

Forscher der Stanford University stellen diese Annahme nun grundlegend infrage. Ihre zentrale These: Wenn man einem einzelnen Agenten und einem Team die gleiche Menge an Rechenleistung gibt, schneidet der Einzelgänger mindestens genauso gut ab.

Jede Übergabe kostet Information

Die Erklärung laut den Forschern: Wenn mehrere Agenten zusammenarbeiten, müssen sie sich gegenseitig Zwischenergebnisse übergeben. Bei jeder dieser Übergaben geht potenziell relevante Information verloren. Ein einzelner Agent hingegen behält alle Informationen in einem durchgängigen Denkprozess.

Für ihre Studie testeten die Forscher vier verschiedene Modelle (Qwen3-30B-A3B, DeepSeek-R1-Distill-Llama-70B sowie Gemini 2.5 Flash und Pro) auf zwei Benchmarks für mehrstufiges Schlussfolgern. Der Einzelagent wurde mit fünf verschiedenen Team-Architekturen verglichen, darunter sequenzielle Ketten, Debatten und Ensemble-Ansätze.

Das Ergebnis war eindeutig: Bei gleichem Rechenbudget war der Einzelagent fast immer die beste oder eine gleichwertige Lösung. Gleichzeitig verbrauchte er deutlich weniger Ressourcen als die Teams.

Lange Kontexte als Achillesferse

Die Studie räumt allerdings ein, dass die theoretische Überlegenheit des Einzelagenten nur bei perfekter Kontextnutzung gilt. In der Praxis haben Sprachmodelle damit Probleme: Je länger ein Denkprozess wird, desto schlechter können sie relevante Informationen von irrelevanten unterscheiden. Die Forschung spricht hier von Phänomenen wie "Context Rot" oder dem "Lost in the Middle"-Effekt, bei dem Modelle Informationen in der Mitte langer Texte übersehen.

Genau hier können Teams ihren Vorteil ausspielen. In Experimenten mit gezielt verfälschtem Eingabetext zeigte sich: Bei starker Verzerrung übertrafen strukturierte Teams den Einzelagenten, weil die Aufteilung half, relevante Informationen besser herauszufiltern. Auch bei schwächeren Basismodellen profitierten Teams stärker, so die Studie. Die Fehleranalyse ergab zudem, dass der Einzelagent manchmal zu eng denkt, während Teams durch ihre breitere Suche gelegentlich Antworten finden, die der Einzelgänger übersieht. Besonders die Debatten-Architektur erwies sich als stärkste Team-Variante.

Die Studie beschränkt sich auf rein textbasierte Denkaufgaben. Ob Teams bei Werkzeugnutzung oder Bildverarbeitung Vorteile bringen, untersucht das Preprint nicht.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 16 % Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: “KI Radar” – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren