Maisas "Knowledge Processing Unit" soll jedes Sprachmodell schlauer machen

Das KI-Start-up Maisa hat mit der "Knowledge Processing Unit" (KPU) ein neuartiges Software-Framework entwickelt, das Sprachmodelle wie GPT-4 oder Claude mit ausgefeilten Reasoning-Fähigkeiten ausstattet - und damit in ersten Tests Spitzenwerte erzielt.

Dabei ist die KPU nicht auf ein bestimmtes Sprachmodell festgelegt, sondern kann modular mit verschiedenen arbeiten. "Man kann sich das wie bei Computern vorstellen: Die Sprachmodelle sind die Hauptprozessoren (CPU) und die KPU ist der Grafikprozessor (GPU) für die Wissensverarbeitung", erklärt Maisa-CEO David Villalón den Ansatz.

Die Architektur setzt sich aus drei Hauptkomponenten zusammen: Die "Reasoning Engine" (der Planer) überlegt sich, wie man die Aufgabe Schritt für Schritt lösen kann und welche Werkzeuge man dafür benötigt. Hier greift Maisa auch auf die Fähigkeiten eines LLMs zurück, derzeit GPT-4.

Die "Execution Engine" (der Ausführer) setzt die Anweisungen des Planers in die Tat um und teilt ihm mit, ob alles geklappt hat oder ob es Probleme gab.

Das Virtual Context Window (der Vermittler) ermöglicht es der KPU, die Fähigkeiten des Sprachmodells optimal zu nutzen, indem es die Daten intelligent verwaltet und nur die für die Problemlösung wirklich benötigten Informationen bereitstellt. So kann sich der Planer voll auf seine Aufgabe konzentrieren und wird nicht mit unwichtigen Details überfrachtet.

Durch diesen gezielten Informationsaustausch kann die KPU längere Texte und komplexere Aufgaben effizient verarbeiten, ohne auf Techniken wie "Chunking" (Aufteilung des Textes in Abschnitte) oder "Embeddings" (Umwandlung von Wörtern in Zahlen) zurückgreifen zu müssen.

Zusätzlich zu den Prompts holt sich das Virtual Context Window selbstständig Informationen aus anderen Quellen wie Wikipedia oder aus herunterladbaren Dateien, wenn diese der Reasoning Engine zu einem besseren Ergebnis verhelfen können.

Der Aufbau der Maisa-"KPU". | Bild: Maisa

Diese Entkopplung von Inferenz und Datenverarbeitung soll laut Maisa typische Schwächen bisheriger Sprachmodelle wie Halluzinationen, begrenzte Kontextfenster, veraltetes Wissen und Inkompatibilität mit externen Systemen umgehen. Gleichzeitig soll das Framework effizienter und kostengünstiger sein als die direkte Verwendung des Modells für komplexe, mehrstufige Logiklösungen.

Demo: Die KPU liest eine E-Mail des Kunden, findet trotz falsch geschriebener Auftragsnummer den richtigen Auftrag und antwortet dem Kunden, wo sich sein Paket befindet. Möglich wird dies durch einen umfangreichen Reasoning-Prozess. | Video: Maisa

Empfehlung

KI in der Praxis

OpenAIs neues Reasoning-Modell "o3" startet ab Ende Januar 2025

Maisa KPU verbessert GPT-4

In ersten Tests hat Maisa mit seiner KPU das bekannte Sprachmodell GPT-4 optimiert. Mit dem Sprachmodell Claude 3 Opus könne KPU die Benchmark-Ergebnisse noch einmal "deutlich" verbessern, so Villalón. Je leistungsfähiger das verwendete Sprachmodell ist, desto besser soll die KPU funktionieren.

In anspruchsvollen Reasoning-Benchmarks wie GSM8k für mathematische Textaufgaben, dem MATH-Datensatz für Mathematikwettbewerbe, der Lese- und Verständnisaufgabe DROP und Teilen von Big-Bench Hard erzielte KPU im Zero-Shot-Ansatz, also ohne zusätzliche Instruktionen oder Beispiele, Spitzenwerte und übertraf führende Sprachmodelle. Die Ergebnisse wurden von Maisa zur Überprüfung veröffentlicht.

Mit einer angeschlossenen KPU soll GPT-4 Turbo mit einfacheren Prompts (0-Shot) zum Teil deutlich bessere Ergebnisse in Logiktests erzielen. | Bild: Maisa

Mögliche Anwendungen sieht Maisa in digitalen Assistenten mit Expertenwissen, der Automatisierung komplexer Prozesse, der Analyse großer Datenmengen oder in intelligenten Lernprogrammen. Durch den modularen Aufbau sei die KPU flexibel einsetzbar und skalierbar.

Derzeit befindet sich die Software noch in der Testphase. Interessenten können sich aber bereits auf eine Warteliste für eine Beta-Version setzen lassen. Einen Termin für die Marktreife nennt Maisa bisher nicht. Das System wird via API und als Web-Interface angeboten.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Sollten sich die Versprechen hinter der KPU bewahrheiten, könnte sie die Fähigkeit von KI-Systemen, eigenständig zu denken und Probleme zu lösen, deutlich verbessern. Es bleibt abzuwarten, ob Maisas Technologie hier ein Alleinstellungsmerkmal hat oder ob ähnliche Ansätze (siehe Q*, Cappy oder Quiet Star) nicht ohnehin von BigAI für die nächste Modellgeneration geplant sind.

Maisas "Knowledge Processing Unit" soll jedes Sprachmodell schlauer machen

OpenAIs neues Reasoning-Modell "o3" startet ab Ende Januar 2025

Maisa KPU verbessert GPT-4

Forscher verstecken LLM-Prompts in Papern, um bessere Bewertungen zu erhalten

Katzen-Attacke auf Reasoning-Modell zeigt, wie wichtig "Context Engineering" ist

LongWriter-Zero lernt nur durch Reinforcement Learning lange Texte zu schreiben

Nach OpenAI bestätigt auch Google Deepmind Mathe-Gold für KI – nur per Sprache

ChatGPT Agent: OpenAI stattet ChatGPT mit autonomen Agenten-Fähigkeiten aus

Kimi K2: Das nächste Open-Model-Wunder nach Deepseek kommt wieder aus China

Maisas "Knowledge Processing Unit" soll jedes Sprachmodell schlauer machen

Maisa KPU verbessert GPT-4

Artikel teilen

Bankverbindung