OpenAIs Chip-Strategie: Unzufriedenheit mit Nvidia führte zu Cerebras-Deal
Kurz & Knapp
- OpenAI ist laut Reuters mit der Geschwindigkeit von Nvidias Inferenz-Chips unzufrieden und sucht Alternativen für etwa zehn Prozent des künftigen Bedarfs.
- Das Unternehmen schloss einen Deal mit Cerebras, dessen Chips schnellere Speicherzugriffe ermöglichen sollen. Groq wurde durch ein 20-Milliarden-Dollar-Abkommen mit Nvidia gebunden.
- Nvidias geplantes 100-Milliarden-Dollar-Investment in OpenAI verzögert sich seit Monaten.
Der ChatGPT-Entwickler ist laut Reuters mit der Geschwindigkeit bestimmter Nvidia-Chips unzufrieden und verhandelt mit Startups, die Alternativen anbieten.
OpenAI ist mit einigen der neuesten KI-Chips von Nvidia unzufrieden und sucht seit dem vergangenen Jahr nach Alternativen. Das berichtet Reuters unter Berufung auf acht Quellen.
Die Kritik richtet sich nicht gegen Chips für das Training von KI-Modellen, bei denen Nvidia dominiert. Stattdessen geht es um Chips für die Inferenz, also den Prozess, bei dem ein trainiertes Modell auf Nutzeranfragen antwortet. Sieben Quellen berichten, OpenAI sei mit der Geschwindigkeit unzufrieden, mit der Nvidias Hardware Antworten generiert. Besonders bei Anwendungen wie Softwareentwicklung mit Codex gebe es Probleme, weil dort Geschwindigkeit besonders wichtig ist. OpenAI benötige neue Hardware für etwa zehn Prozent des künftigen Inferenz-Bedarfs.
Inferenz erfordert andere Chip-Architekturen
Mitarbeiter hätten Schwächen teilweise auf Nvidia-Hardware zurückgeführt. Inferenz erfordert mehr Speicherzugriffe als Training. Nvidia-GPUs nutzen externen Speicher, was die Verarbeitung verlangsamt. OpenAI sucht deshalb Chips mit SRAM, das direkt auf dem Siliziumchip eingebettet ist und Geschwindigkeitsvorteile bietet.
OpenAI verhandelte laut Reuters mit Startups wie Cerebras und Groq. Cerebras lehnte ein Nvidia-Übernahmeangebot ab und schloss stattdessen einen Deal mit OpenAI. CEO Sam Altman bestätigte Ende Januar, dass der Cerebras-Deal Geschwindigkeitsanforderungen für Coding-Modelle erfüllen soll.
Bei Groq verliefen die Gespräche anders: Im Dezember schloss Nvidia ein 20-Milliarden-Dollar-Lizenzabkommen mit dem Startup ab, das OpenAIs Verhandlungen beendete. Nvidia stellte zudem Groqs Chip-Designer ein. Nvidia hat mit dem Rubin CPX zudem einen spezialisierten Beschleuniger vorgestellt, der gezielt für die Prefill-Phase der KI-Inferenz entwickelt wurde.
100-Milliarden-Investment verzögert sich
Im September hatte Nvidia angekündigt, bis zu 100 Milliarden Dollar in OpenAI zu investieren. Der Abschluss war innerhalb von Wochen erwartet worden, stattdessen ziehen sich die Verhandlungen seit Monaten hin. OpenAIs sich ändernde Produkt-Roadmap habe die Gespräche verlangsamt, so eine Quelle.
Nvidia-CEO Jensen Huang wies Berichte über Spannungen am Samstag als "Unsinn" zurück. Das Unternehmen will mehrere zehn Milliarden Dollar investieren. Ein OpenAI-Sprecher erklärte, das Unternehmen verlasse sich weiterhin auf Nvidia für den Großteil seiner Inferenz-Flotte.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnieren