Das KI-Start-up Maisa hat mit der "Knowledge Processing Unit" (KPU) ein neuartiges Software-Framework entwickelt, das Sprachmodelle wie GPT-4 oder Claude mit ausgefeilten Reasoning-Fähigkeiten ausstattet - und damit in ersten Tests Spitzenwerte erzielt.
Dabei ist die KPU nicht auf ein bestimmtes Sprachmodell festgelegt, sondern kann modular mit verschiedenen arbeiten. "Man kann sich das wie bei Computern vorstellen: Die Sprachmodelle sind die Hauptprozessoren (CPU) und die KPU ist der Grafikprozessor (GPU) für die Wissensverarbeitung", erklärt Maisa-CEO David Villalón den Ansatz.
Die Architektur setzt sich aus drei Hauptkomponenten zusammen: Die "Reasoning Engine" (der Planer) überlegt sich, wie man die Aufgabe Schritt für Schritt lösen kann und welche Werkzeuge man dafür benötigt. Hier greift Maisa auch auf die Fähigkeiten eines LLMs zurück, derzeit GPT-4.
Die "Execution Engine" (der Ausführer) setzt die Anweisungen des Planers in die Tat um und teilt ihm mit, ob alles geklappt hat oder ob es Probleme gab.
Das Virtual Context Window (der Vermittler) ermöglicht es der KPU, die Fähigkeiten des Sprachmodells optimal zu nutzen, indem es die Daten intelligent verwaltet und nur die für die Problemlösung wirklich benötigten Informationen bereitstellt. So kann sich der Planer voll auf seine Aufgabe konzentrieren und wird nicht mit unwichtigen Details überfrachtet.
Durch diesen gezielten Informationsaustausch kann die KPU längere Texte und komplexere Aufgaben effizient verarbeiten, ohne auf Techniken wie "Chunking" (Aufteilung des Textes in Abschnitte) oder "Embeddings" (Umwandlung von Wörtern in Zahlen) zurückgreifen zu müssen.
Zusätzlich zu den Prompts holt sich das Virtual Context Window selbstständig Informationen aus anderen Quellen wie Wikipedia oder aus herunterladbaren Dateien, wenn diese der Reasoning Engine zu einem besseren Ergebnis verhelfen können.
Diese Entkopplung von Inferenz und Datenverarbeitung soll laut Maisa typische Schwächen bisheriger Sprachmodelle wie Halluzinationen, begrenzte Kontextfenster, veraltetes Wissen und Inkompatibilität mit externen Systemen umgehen. Gleichzeitig soll das Framework effizienter und kostengünstiger sein als die direkte Verwendung des Modells für komplexe, mehrstufige Logiklösungen.
Maisa KPU verbessert GPT-4
In ersten Tests hat Maisa mit seiner KPU das bekannte Sprachmodell GPT-4 optimiert. Mit dem Sprachmodell Claude 3 Opus könne KPU die Benchmark-Ergebnisse noch einmal "deutlich" verbessern, so Villalón. Je leistungsfähiger das verwendete Sprachmodell ist, desto besser soll die KPU funktionieren.
In anspruchsvollen Reasoning-Benchmarks wie GSM8k für mathematische Textaufgaben, dem MATH-Datensatz für Mathematikwettbewerbe, der Lese- und Verständnisaufgabe DROP und Teilen von Big-Bench Hard erzielte KPU im Zero-Shot-Ansatz, also ohne zusätzliche Instruktionen oder Beispiele, Spitzenwerte und übertraf führende Sprachmodelle. Die Ergebnisse wurden von Maisa zur Überprüfung veröffentlicht.
Mögliche Anwendungen sieht Maisa in digitalen Assistenten mit Expertenwissen, der Automatisierung komplexer Prozesse, der Analyse großer Datenmengen oder in intelligenten Lernprogrammen. Durch den modularen Aufbau sei die KPU flexibel einsetzbar und skalierbar.
Derzeit befindet sich die Software noch in der Testphase. Interessenten können sich aber bereits auf eine Warteliste für eine Beta-Version setzen lassen. Einen Termin für die Marktreife nennt Maisa bisher nicht. Das System wird via API und als Web-Interface angeboten.
Sollten sich die Versprechen hinter der KPU bewahrheiten, könnte sie die Fähigkeit von KI-Systemen, eigenständig zu denken und Probleme zu lösen, deutlich verbessern. Es bleibt abzuwarten, ob Maisas Technologie hier ein Alleinstellungsmerkmal hat oder ob ähnliche Ansätze (siehe Q*, Cappy oder Quiet Star) nicht ohnehin von BigAI für die nächste Modellgeneration geplant sind.