Inhalt
summary Zusammenfassung

Das japanische KI-Start-up Sakana AI hat eine neue Methode entwickelt, bei der mehrere große Sprachmodelle wie ChatGPT und Gemini gemeinsam an einem Problem arbeiten. Erste Tests zeigen, dass diese Zusammenarbeit deutlich bessere Ergebnisse liefert als einzelne Modelle allein.

Anzeige

Sakana AI hat mit AB-MCTS (Adaptive Branching Monte Carlo Tree Search) einen Algorithmus vorgestellt, der es erlaubt, mehrere KI-Modelle zur selben Zeit auf ein Problem anzusetzen. Die Modelle helfen sich gegenseitig, indem sie Vorschläge austauschen und verbessern – ganz ähnlich wie Menschen in einem Team zusammenarbeiten.

Der Algorithmus kombiniert zwei Arten von Suchstrategien: Er kann entweder eine bestehende Lösung verfeinern (Tiefensuche) oder ganz neue Lösungsansätze ausprobieren (Breitensuche). Dabei entscheidet ein Wahrscheinlichkeitsmodell ständig, in welche Richtung es weitergehen soll.

Bei der Multi-LLM-Variante (Multi LLM AB-MCTS) wählt das System zusätzlich aus, welches Modell – etwa ChatGPT, Gemini oder DeepSeek – gerade am besten geeignet ist. Diese Auswahl passt sich dynamisch an, je nachdem, welches Modell bei einem bestimmten Problem die besten Ergebnisse liefert.

Anzeige
Anzeige
Liniendiagramm: Erfolgskurve von AB-MCTS auf ARC-AGI-2 für verschiedene LLM-Kombinationen, Multi-LLM liegt vorn
Multimodale LLM-Kombinationen steigern die Pass@k-Performance von AB-MCTS auf ARC-AGI-2 bei wachsender Zahl von LLM-Anfragen. Die Kombination o4-mini, Gemini-2.5-Pro und R1-0528 führt deutlich vor Einzelmodellen. | Bild: Sakana AI

AB-MCTS zeigt Erfolge in ARC-AGI-2

In Tests mit dem anspruchsvollen Benchmark ARC-AGI-2 konnte Multi-LLM AB-MCTS mehr als jedes Einzelmodell im Alleingang (Single-LLM AB-MCTS) lösen. In mehreren Fällen führte erst die Kombination verschiedener Modelle zur richtigen Lösung.

Es bleiben aber Schwächen: Wenn das System beliebig viele Lösungsvorschläge ausprobieren darf, findet es in etwa 30 Prozent der Fälle eine richtige Antwort. Im offiziellen ARC-AGI-2-Benchmark dürfen Einreichungen aber oft nur ein oder zwei Antworten abgeben – und hier sinkt die Erfolgsquote deutlich. Um das zu verbessern, will Sakana AI neue Methoden entwickeln, mit denen das System die besten Vorschläge automatisch erkennt und auswählt. Denkbar sei auch, dass ein weiteres KI-Modell die Vorschläge bewertet. Außerdem soll der Ansatz mit anderen Ideen kombiniert werden, etwa mit KI-Systemen, die miteinander diskutieren.

Sakana AI stellt den Algorithmus als Open-Source-Software unter dem Namen TreeQuest bereit. Damit können andere Entwickler die Methode auf eigene Probleme anwenden.

Vor TreeQuest zeigte Sakana AI bereits mit der Darwin-Gödel-Maschine, wie sich Coding-Agenten durch gezielte Selbst­modifikation von 20 auf 50 Prozent Erfolgs­quote auf SWE-bench hocharbeiten – ein erster Beweis dafür, dass sich das Start-up nicht nur auf Kollaboration, sondern auch auf Evolution seiner Modelle fokussiert.

Zuvor hatte das Team mit der Continuous Thought Machine ein LLM-Konzept vorgestellt, das neuronale Zeit­dynamiken simuliert und Aufgaben in mehreren „Denkschritten“ löst. Zusammen mit dem neuen Multi-LLM-Ansatz unterstreichen beide Projekte Sakana AIs Leitidee, natürliche Prinzipien – von synchronisierten Neuronen bis zu Darwin’schem Auslese­druck – für resilientere, anpassungs­fähige KI-Systeme zu nutzen.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Das japanische Start-up Sakana AI hat mit AB-MCTS einen Algorithmus entwickelt, bei dem mehrere große Sprachmodelle wie ChatGPT und Gemini gemeinsam an einem Problem arbeiten, indem sie Vorschläge austauschen und verbessern.
  • AB-MCTS kombiniert verschiedene Suchstrategien und wählt dynamisch das jeweils am besten geeignete Sprachmodell aus, was in Tests mit dem Benchmark ARC-AGI-2 zu besseren Ergebnissen führte als einzelne Modelle alleine.
  • Trotz Erfolgen gibt es Einschränkungen bei der Auswahl der besten Lösungsvorschläge. Sakana AI plant deshalb weitere Verbesserungen und stellt den Algorithmus als Open Source unter dem Namen TreeQuest zur Verfügung.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!