DeepThought-8B: Ruliad veröffentlicht offenes "Reasoning"-Modell

Das KI-Start-up Ruliad hat ein neues Sprachmodell namens DeepThought-8B vorgestellt, das seinen Denkprozess in strukturierter Form offenlegt. Trotz seiner geringen Größe soll es mit deutlich größeren Modellen mithalten können.

Das neue KI-Modell DeepThought-8B von Ruliad dokumentiert seine Schlussfolgerungen Schritt für Schritt in einem strukturierten JSON-Format. Laut den Entwicklern macht dies die Entscheidungsfindung des Modells transparenter und kontrollierbarer.

Screenshot eines KI-Dialogs: Deepthought analysiert die Frage nach dem Sinn des Lebens in strukturierten Denkschritten mit transparentem Reasoning-Prozess. — Wie bei OpenAI o1 zeigt DeepThought-8B die Nachdenk-Dauer und die gegangenen Argumentationsschritte. | Bild: Screenshot by THE DECODER

Wie Ruliad in einem Blogpost mitteilt, basiert DeepThought-8B auf dem Sprachmodell Llama-3.1 8B und läuft lokal auf Grafikkarten ab 16 GB Speicher. Anders als das zugrundeliegende Modell löst DeepThought-8B Probleme jedoch primär in mehreren Schritten. Das Team nennt das "Reasoning Chain" - es handelt sich im Kern um Chain-of-Thought-Abfolgen. Diese Schritte werden wie auch bei OpenAIs "Structured Outputs" in einem maschinenlesbaren JSON-Format ausgegeben.

{ "step": 1,
"type": "problem_understanding",
"thought": "The user is asking how many Rs there are in the word 'strawberry'" }

Beispiel für strukturierte DeepThought-Ausgabe

Eine Besonderheit ist die Möglichkeit in diese "Reasoning Chains" einzugreifen: Das Modell unterstützt es sogenannte "Injections" namens Scripted, Max Routing und Thought Routing. Bei Scripted lassen sich im Vorfeld konkrete Argumentationspunkte festlegen.

Demo-Video für das "Thought Routing" von DeepThought-8B. | Video: Ruliad

Max Routing erlaubt sowohl eine maximale Anzahl an Denkschritten zu wählen als auch zu bestimmen, wie DeepThought-8B die Gedankenkette abschließen soll. Über Thought Routing werden Wenn/Dann-Regeln bestimmt, die dynamisch je nach Chatverlauf zum Einsatz kommen.

Ruliad setzt auf Test-time compute

Laut Ruliad kann das Modell die Tiefe seiner Analyse an die Komplexität der Aufgabe anpassen, das sogenannte "Test-time Compute Scaling". Damit soll die Performance eines Sprachmodells durch mehr Rechenleistung während der Inferenz steigern. Auch OpenAIs o1-Modell setzt auf diesen Ansatz, unterscheidet sich jedoch mutmaßlich im Einsatz von Reinforcement Learning im Training und internen Chain-of-Thoughts von Ruliads Modell. Wie genau o1 trainiert wurde und wie es funktioniert, ist jedoch bisher nicht bekannt.

Das Unternehmen betont, dass DeepThought-8B trotz seiner vergleichsweise geringen Größe in Benchmarks für Reasoning, Mathematik und Programmierung konkurrenzfähige Ergebnisse erzielt. Über verschiedene Benchmarks hinweg liegt es etwa auf Niveau der viel größeren Qwen-2-72B und Llama-3.1-70B, jedoch unter Claude 3.5 Sonnet, GPT-4o und o1-mini.

Balkendiagramm: Leistungsvergleich von KI-Sprachmodellen mit Kategorien All, Math, Coding, Reasoning und IF, Leistungswerte zwischen 45-70%. — Im Schnitt schlägt DeepThought-8B trotz nur rund einem Zehntel der Parameterzahl größere Sprachmodelle wie Qwen-2-72B und Llama-3.1-70B. | Bild: Ruliad/Screenshot by THE DECODER

Als Einschränkungen nennt das Team komplexes mathematisches Reasoning, die Verarbeitung langer Kontexte und der Umgang mit Randfällen.

Empfehlung

KI-Forschung

KI schlägt Neurowissenschaftler bei der Vorhersage von Forschungsergebnissen

DeepThought-8B auf Hugging Face, API und Demo

Ruliad hat die Gewichte des Modells daher Open Source auf Hugging Face veröffentlicht. In den kommenden Wochen soll eine Entwickler-API folgen, die sich derzeit in geschlossener Beta-Phase befindet. Bis dahin lässt sich DeepThought-8B bereits kostenlos nach Google-Login über chat.ruliad.co ausprobieren.

In den letzten Wochen haben auch andere Unternehmen Reasoning-Modelle auf den Markt gebracht, so etwa DeepSeek-R1 und Qwen QwQ.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

DeepThought-8B: Ruliad veröffentlicht offenes "Reasoning"-Modell

Ruliad setzt auf Test-time compute

KI schlägt Neurowissenschaftler bei der Vorhersage von Forschungsergebnissen

DeepThought-8B auf Hugging Face, API und Demo

xAI-Mitgründer Igor Babuschkin verlässt Musk-Projekt und startet Fonds für KI-Sicherheit

Reuters: USA bauen verdeckte Ortungstechnik in KI-Chip-Lieferungen ein

Perplexity bietet 34,5 Milliarden für Chrome – erneut PR-Stunt wie bei TikTok

OpenAI startet GPT-5 – mit besserem Verständnis, Personalisierung und Entwickler-Tools

Google Deepmind zeigt mit Genie 3 ein KI-Modell für interaktive Welten in Echtzeit

Google schaltet Gemini 2.5 Deep Think frei – und zieht erste Sicherheitsgrenzen

DeepThought-8B: Ruliad veröffentlicht offenes "Reasoning"-Modell

Ruliad setzt auf Test-time compute

DeepThought-8B auf Hugging Face, API und Demo

Artikel teilen

Bankverbindung