Mit Thinking Machines Lab verfolgt Ex-OpenAI-CTO Mira Murati offenbar einen klar spezialisierenden KI-Ansatz. Statt auf eine allgemeine Super-KI zu setzen, will sie mit individuell angepassten KI-Modellen für Unternehmen Geld verdienen.
Das KI-Start-up Thinking Machines Lab (TML) unter der Leitung der ehemaligen OpenAI-Technikchefin Mira Murati positioniert sich mit einem ungewöhnlich fokussierten Geschäftsmodell in einem zunehmend überhitzten Markt. Laut The Information will das Unternehmen KI-Modelle entwickeln, die auf wirtschaftliche Kennzahlen einzelner Firmen abgestimmt sind.
TML setzt dabei auf Verstärkungslernen (Reinforcement Learning), bei dem Modelle für bestimmte Zielerreichungen belohnt und für unerwünschtes Verhalten bestraft werden. Investoren bezeichnen diesen Ansatz als "RL for businesses". Ziel könnte es sein, für Sektoren wie Kundenservice, Investmentbanking oder Einzelhandel maßgeschneiderte KI-Lösungen bereitzustellen – und dafür einen deutlichen Preisaufschlag zu rechtfertigen.
Das klingt so, als würde Murati der Empfehlung von Rohan Pandey nachkommen, einem Forscher bei OpenAI, der das LLM-RL-Paradigma als besonders vielversprechend für vertikale KI-Start-ups bezeichnet. Reinforcement Learning ermögliche spezialisiertes Training für spezifische Aufgaben und Branchen – ein Bereich, der selbst für OpenAI schwer zu skalieren sei. OpenAI hat Ende 2024 mit RFT (Reinforcement Fine-Tuning) eine entsprechende Entwicklerschnittstelle eingeführt, die jedoch bislang nur ausgewählten Partnern offensteht.
Model-Layer-Sharing und Open-Source als Entwicklungsstrategie
Technisch setzt TML auf die Kombination einzelner neuronaler Netzwerkschichten verschiedener existierender Open-Source-Modelle. Diese Methode – vergleichbar mit dem sogenannten Model Merging – soll Entwicklungszeiten verkürzen und die Stärken spezialisierter Modelle bündeln. Die genutzte Recheninfrastruktur basiert auf Nvidia-Servern, die über Google Cloud gemietet werden.
Obwohl Open-Source-Modelle gegenüber kommerziellen Lösungen wie GPT-4o leistungsmäßig meist unterlegen sind, haben jüngste Entwicklungen wie Deepseek gezeigt, dass der Unterschied kleiner wird. TML will diese Lücke wirtschaftlich nutzen und schneller Produkte auf den Markt bringen.
Neben Unternehmenslösungen plant TML auch ein bisher nicht näher beschriebenes Konsumentenprodukt. Intern war zwischenzeitlich ein Chatbot im Gespräch, der mit OpenAIs ChatGPT konkurrieren könnte. Welche Form dieses Produkt annehmen wird, ist offen.
TML hat laut The Information in kurzer Zeit über zwei Dutzend hochkarätige Forscher und Ingenieure von OpenAI und Anthropic abgeworben – darunter John Schulman, Mitgründer von OpenAI, und die früheren OpenAI-Forscher Barret Zoph und Luke Metz.
Was hat Murati bei OpenAI nicht gesehen?
Muratis Ausstieg bei OpenAI folgte einer Phase interner Spannungen, in der sie sich laut Berichten zwischenzeitlich gegen CEO Sam Altman stellte; Murati selbst bestreitet das.
Doch abseits dieser Machtkämpfe drängt sich eine strategische Frage auf: Warum verlässt eine Technikchefin ein Unternehmen, das angeblich kurz vor dem Durchbruch zur generalisierten Allzweck-KI (AGI) stehen soll?
Murati kennt OpenAIs Pläne und Fähigkeiten – und hat sich dennoch, oder gerade deshalb, für einen anderen Kurs entschieden.
Ein möglicher Grund liegt im Geschäftsmodell. Eine AGI mag technologisch ambitioniert sein, ist aber wirtschaftlich riskant. Spezialisierte Modelle, die direkt auf Umsatz und Effizienz optimiert sind, lassen sich schneller entwickeln, gezielter vermarkten und besser skalieren.
Denkbar ist zudem, dass sie nicht an eine AGI mit heutiger LLM-Technologie glaubt. Dafür spricht ihre Strategie: Sie setzt auf pragmatische Spezialisierung statt auf universelle Intelligenz.