Das japanische KI-Start-up Sakana AI hat eine neue Methode entwickelt, bei der mehrere große Sprachmodelle wie ChatGPT und Gemini gemeinsam an einem Problem arbeiten. Erste Tests zeigen, dass diese Zusammenarbeit deutlich bessere Ergebnisse liefert als einzelne Modelle allein.
Sakana AI hat mit AB-MCTS (Adaptive Branching Monte Carlo Tree Search) einen Algorithmus vorgestellt, der es erlaubt, mehrere KI-Modelle zur selben Zeit auf ein Problem anzusetzen. Die Modelle helfen sich gegenseitig, indem sie Vorschläge austauschen und verbessern – ganz ähnlich wie Menschen in einem Team zusammenarbeiten.
Der Algorithmus kombiniert zwei Arten von Suchstrategien: Er kann entweder eine bestehende Lösung verfeinern (Tiefensuche) oder ganz neue Lösungsansätze ausprobieren (Breitensuche). Dabei entscheidet ein Wahrscheinlichkeitsmodell ständig, in welche Richtung es weitergehen soll. Bei der Multi-LLM-Variante (Multi LLM AB-MCTS) wählt das System zusätzlich aus, welches Modell – etwa ChatGPT, Gemini oder DeepSeek – gerade am besten geeignet ist. Diese Auswahl passt sich dynamisch an, je nachdem, welches Modell bei einem bestimmten Problem die besten Ergebnisse liefert.
AB-MCTS zeigt Erfolge in ARC-AGI-2
In Tests mit dem anspruchsvollen Benchmark ARC-AGI-2 konnte Multi-LLM AB-MCTS mehr als jedes Einzelmodell im Alleingang (Single-LLM AB-MCTS) lösen. In mehreren Fällen führte erst die Kombination verschiedener Modelle zur richtigen Lösung.
Es bleiben aber Schwächen: Wenn das System beliebig viele Lösungsvorschläge ausprobieren darf, findet es in etwa 30 Prozent der Fälle eine richtige Antwort. Im offiziellen ARC-AGI-2-Benchmark dürfen Einreichungen aber oft nur ein oder zwei Antworten abgeben – und hier sinkt die Erfolgsquote deutlich. Um das zu verbessern, will Sakana AI neue Methoden entwickeln, mit denen das System die besten Vorschläge automatisch erkennt und auswählt. Denkbar sei auch, dass ein weiteres KI-Modell die Vorschläge bewertet. Außerdem soll der Ansatz mit anderen Ideen kombiniert werden, etwa mit KI-Systemen, die miteinander diskutieren.
Sakana AI stellt den Algorithmus als Open-Source-Software unter dem Namen TreeQuest bereit. Damit können andere Entwickler die Methode auf eigene Probleme anwenden.