Mit MAI-Voice-1 und MAI-1-preview stellt Microsoft zwei neue KI-Modelle vor, die eigene Produkte wie Copilot unterstützen sollen – und das Verhältnis zu OpenAI neu definieren könnten.
Microsoft hat zwei neue KI-Modelle vorgestellt, die vollständig intern entwickelt wurden: das Sprachmodell MAI-Voice-1 und das Textmodell MAI-1-preview. Die Ankündigung markiert einen strategischen Schritt hin zu mehr Unabhängigkeit von OpenAI, dessen Modelle bislang zentrale Bestandteile von Microsofts Copilot-Produkten waren.
Laut Microsoft soll MAI-Voice-1 besonders effizient und expressiv sein. Das Modell kann eine Minute Audiomaterial in weniger als einer Sekunde auf nur einer GPU erzeugen und sei damit eines der schnellsten Sprachsysteme auf dem Markt. Es kommt bereits in Copilot Daily und Podcasts zum Einsatz und kann auch in Copilot Labs getestet werden.
MAI-1-preview: Textmodell mit Effizienzfokus
Das zweite Modell, MAI-1-preview, ist Microsoft erstes Foundation-Modell und wurde laut Microsoft auf rund 15.000 NVIDIA H100 GPUs trainiert – deutlich weniger als etwa xAIs Grok, das mehr als 100.000 GPUs nutzte. Ziel sei es laut Microsoft gewesen es, ein Modell zu entwickeln, das mit vergleichsweise geringen Ressourcen leistungsfähige Antworten liefern kann. Davor hatte Microsoft nur die kleineren Sprachmodelle der Phi-Reihe entwickelt.
Mustafa Suleyman, Chef der Microsoft AI-Abteilung (MAI), betont gegenüber Semafor, dass das Modell „weit über sein Gewicht hinaus kämpfe“. Entscheidend sei nicht nur die Rechenleistung, sondern die Auswahl der Trainingsdaten und der effiziente Umgang mit Rechenressourcen: "Man sollte keine Flops für Tokens verschwenden, die dem Modell nichts beibringen."
MAI-1-preview ist derzeit über die Plattform LMArena öffentlich testbar und wird schrittweise in Copilot-Funktionen integriert. In der LMArena liegt das Modell aktuell auf Platz 13, Benchmarks hat das Unternehmen nicht veröffentlicht.
Entwickler können sich für einen API-Zugang bewerben, um das Modell frühzeitig zu testen.
Eigene Infrastruktur, eigene Vision
Mit dem Aufbau eigener Modelle verfolgt Microsoft eine langfristige Strategie. Suleyman spricht von einem „fünfjährigen Fahrplan“ mit fortlaufenden Investitionen. Zum Einsatz kommt unter anderem ein neuer Rechencluster auf Basis von Nvidias GB200-Chips. Ziel sei es, spezialisierte Modelle für unterschiedliche Anwendungsfälle zu orchestrieren – und die eigene KI-Plattform in Windows, Office und Azure zu integrieren.
Ein weiterer Fokus liegt auf der Gestaltung der Modelle im sogenannten Post-Training-Prozess. Laut Suleyman will Microsoft gezielt Eigenschaften entfernen, die den Eindruck erwecken könnten, die KI habe Gefühle oder Ziele. In einem Essay hatte er zuvor vor den Risiken „scheinbar bewusster KI“ gewarnt, die menschliches Verhalten imitiert: „Jetzt ist der Moment, in dem wir aktiv über diese Gefahren nachdenken müssen.“
Neue Spannungen mit OpenAI?
Microsoft ist mit bis zu 13 Milliarden US-Dollar der größte Investor von OpenAI, mit diversen Exklusiv-Vereinbarungen. Aktuell befinden sich beide Unternehmen in harten Verhandlungen um die geplante Umstrukturierung von OpenAI. Die Entwicklung eigener Modelle scheint so auch ein klares Zeichen an OpenAI. Suleyman betont jedoch: „Unser Ziel ist es, die Partnerschaft zu vertiefen und eine großartige Zusammenarbeit über viele Jahre hinweg sicherzustellen.“