Inhalt
summary Zusammenfassung

Das KI-Start-up Maisa hat mit der "Knowledge Processing Unit" (KPU) ein neuartiges Software-Framework entwickelt, das Sprachmodelle wie GPT-4 oder Claude mit ausgefeilten Reasoning-Fähigkeiten ausstattet - und damit in ersten Tests Spitzenwerte erzielt.

Dabei ist die KPU nicht auf ein bestimmtes Sprachmodell festgelegt, sondern kann modular mit verschiedenen arbeiten. "Man kann sich das wie bei Computern vorstellen: Die Sprachmodelle sind die Hauptprozessoren (CPU) und die KPU ist der Grafikprozessor (GPU) für die Wissensverarbeitung", erklärt Maisa-CEO David Villalón den Ansatz.

Die Architektur setzt sich aus drei Hauptkomponenten zusammen: Die "Reasoning Engine" (der Planer) überlegt sich, wie man die Aufgabe Schritt für Schritt lösen kann und welche Werkzeuge man dafür benötigt. Hier greift Maisa auch auf die Fähigkeiten eines LLMs zurück, derzeit GPT-4.

Die "Execution Engine" (der Ausführer) setzt die Anweisungen des Planers in die Tat um und teilt ihm mit, ob alles geklappt hat oder ob es Probleme gab.

Anzeige
Anzeige

Das Virtual Context Window (der Vermittler) ermöglicht es der KPU, die Fähigkeiten des Sprachmodells optimal zu nutzen, indem es die Daten intelligent verwaltet und nur die für die Problemlösung wirklich benötigten Informationen bereitstellt. So kann sich der Planer voll auf seine Aufgabe konzentrieren und wird nicht mit unwichtigen Details überfrachtet.

Durch diesen gezielten Informationsaustausch kann die KPU längere Texte und komplexere Aufgaben effizient verarbeiten, ohne auf Techniken wie "Chunking" (Aufteilung des Textes in Abschnitte) oder "Embeddings" (Umwandlung von Wörtern in Zahlen) zurückgreifen zu müssen.

Zusätzlich zu den Prompts holt sich das Virtual Context Window selbstständig Informationen aus anderen Quellen wie Wikipedia oder aus herunterladbaren Dateien, wenn diese der Reasoning Engine zu einem besseren Ergebnis verhelfen können.

Der Aufbau der Maisa-"KPU". | Bild: Maisa

Diese Entkopplung von Inferenz und Datenverarbeitung soll laut Maisa typische Schwächen bisheriger Sprachmodelle wie Halluzinationen, begrenzte Kontextfenster, veraltetes Wissen und Inkompatibilität mit externen Systemen umgehen. Gleichzeitig soll das Framework effizienter und kostengünstiger sein als die direkte Verwendung des Modells für komplexe, mehrstufige Logiklösungen.

Demo: Die KPU liest eine E-Mail des Kunden, findet trotz falsch geschriebener Auftragsnummer den richtigen Auftrag und antwortet dem Kunden, wo sich sein Paket befindet. Möglich wird dies durch einen umfangreichen Reasoning-Prozess. | Video: Maisa

Empfehlung

Maisa KPU verbessert GPT-4

In ersten Tests hat Maisa mit seiner KPU das bekannte Sprachmodell GPT-4 optimiert. Mit dem Sprachmodell Claude 3 Opus könne KPU die Benchmark-Ergebnisse noch einmal "deutlich" verbessern, so Villalón. Je leistungsfähiger das verwendete Sprachmodell ist, desto besser soll die KPU funktionieren.

In anspruchsvollen Reasoning-Benchmarks wie GSM8k für mathematische Textaufgaben, dem MATH-Datensatz für Mathematikwettbewerbe, der Lese- und Verständnisaufgabe DROP und Teilen von Big-Bench Hard erzielte KPU im Zero-Shot-Ansatz, also ohne zusätzliche Instruktionen oder Beispiele, Spitzenwerte und übertraf führende Sprachmodelle. Die Ergebnisse wurden von Maisa zur Überprüfung veröffentlicht.

Mit einer angeschlossenen KPU soll GPT-4 Turbo mit einfacheren Prompts (0-Shot) zum Teil deutlich bessere Ergebnisse in Logiktests erzielen. | Bild: Maisa

Mögliche Anwendungen sieht Maisa in digitalen Assistenten mit Expertenwissen, der Automatisierung komplexer Prozesse, der Analyse großer Datenmengen oder in intelligenten Lernprogrammen. Durch den modularen Aufbau sei die KPU flexibel einsetzbar und skalierbar.

Derzeit befindet sich die Software noch in der Testphase. Interessenten können sich aber bereits auf eine Warteliste für eine Beta-Version setzen lassen. Einen Termin für die Marktreife nennt Maisa bisher nicht. Das System wird via API und als Web-Interface angeboten.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Sollten sich die Versprechen hinter der KPU bewahrheiten, könnte sie die Fähigkeit von KI-Systemen, eigenständig zu denken und Probleme zu lösen, deutlich verbessern. Es bleibt abzuwarten, ob Maisas Technologie hier ein Alleinstellungsmerkmal hat oder ob ähnliche Ansätze (siehe Q*, Cappy oder Quiet Star) nicht ohnehin von BigAI für die nächste Modellgeneration geplant sind.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Das KI-Start-up Maisa hat mit der "Knowledge Processing Unit" (KPU) ein neuartiges Software-Framework entwickelt, das Sprachmodelle wie GPT-4 oder Claude mit ausgefeilten Reasoning-Fähigkeiten ausstattet und damit in ersten Tests Spitzenwerte erzielt.
  • Die KPU-Architektur besteht aus drei wesentlichen Komponenten: Die "Reasoning Engine" (das angeschlossene LLM) plant die Schritte zur Problemlösung, die "Execution Engine" führt die Anweisungen aus und das "Virtual Context Window" verwaltet die Daten intelligent, so dass sich das LLM bei der Schussfolgerung ausschließlich auf relevante Inhalte konzentrieren kann.
  • In anspruchsvollen Reasoning-Benchmarks übertraf die KPU auf Basis von GPT-4 mit Prompts ohne Beispiele oder Ergänzungen (Zero-Shot) führende Sprachmodelle ohne KPU, aber mit komplexen Reasoning-Prompts wie Chain of thought.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!