- Statement von Sam Altman ergänzt
Update vom 28. Januar 2025:
Der Wirbel um Deepseks R1-Modell hat Nvidia gestern mehr als ein Stargate-Projekt gekostet: rund 589 Milliarden Dollar an Marktkapitalisierung büßte der Chipkonzern in der Spitze ein - laut Financial Times ein Rekordverlust an den US-Börsen.
Microsoft-CEO Satya Nadella hatte bereits im Vorfeld versucht, der negativen Stimmung an den Börsen entgegenzuwirken (siehe Bericht unten). Nun zieht auch OpenAI-Chef Sam Altman nach: Deepseek-R1 sei ein "beeindruckendes Modell", insbesondere was das Preis-Leistungs-Verhältnis angehe, so Altman bei X. "Natürlich" würde OpenAI viel bessere Modelle liefern, und ein neuer Konkurrent sei "belebend". OpenAI würde einige Veröffentlichungen beschleunigen.
Der Fokus liege aber weiterhin auf der Forschungsroadmap, und "mehr Rechenleistung ist jetzt wichtiger denn je", so Altman. Die Welt wolle viel KI nutzen, womit er wie Nadella auf das Jevons-Paradox anspielt: Die Technologie wird zwar effizienter, verbreitet sich aber gleichzeitig viel stärker, sodass die Kosten für ihren Einsatz weiter steigen.
Auch US-Präsident Trump und Nvidia äußern sich zum Erfolg von Deepseek. Trump sieht Deepseek als "Weckruf für die US-Wirtschaft", sofern das chinesische Start-up korrekt berichtet und KI-Modelle tatsächlich für weniger Geld effizienter gemacht hat.
Nvidia bezeichnet Deepseek als "exzellenten KI-Fortschritt" und perfektes Beispiel für Test-Time-Scaling, das weiterhin eine "signifikante Anzahl" von Nvidia-GPUs in einem Hochleistungsnetzwerk benötige.
Ursprünglicher Artikel vom 27. Januar:
Deepseeks Erfolg setzt US-Chip-Aktien unter Druck
Der Erfolg des chinesischen KI-Start-ups Deepseek hat Meta in Alarmbereitschaft versetzt. Der Social-Media-Konzern reagiert mit der Einrichtung mehrerer Krisenteams. Auch US-Chip-Aktien bekommen Deepseeks Effizienz zu spüren.
Wie The Information berichtet, herrscht bei Metas KI-Abteilung derzeit Ausnahmezustand. Führungskräfte des Unternehmens äußern intern die Sorge, dass die nächste Version von Metas Flaggschiff-KI Llama der chinesischen Konkurrenz Deepseek unterlegen sein könnte.
Als Reaktion hat Meta vier spezialisierte "War Rooms" eingerichtet, um Deepseek zu analysieren und die Erkenntnisse in die Verbesserung von Llama einfließen zu lassen. Zwei dieser Teams konzentrieren sich darauf, die kostengünstigeren Trainings- und Betriebsmethoden von Deepseek zu verstehen und zu adaptieren.
Ein weiteres Krisenteam bei Meta untersucht, welche Trainingsdaten das chinesische High-Flyer-Start-up für Deepseek-Modelle verwendet haben könnte. Das vierte Team prüft, wie Meta seine Modelle nach dem Vorbild von Deepseek umstrukturieren kann, um sie effizienter zu machen.
Der Bericht von The Information bestätigt einen Mitarbeiter-Leak auf der Plattform "Blind". Auch hier war von Panik in Metas KI-Abteilung und einer intensiven Analyse von Deepseeks Technologien die Rede.
Meta-Sprecher Jon Carvill betont in einer Stellungnahme gegenüber The Information, dass man regelmäßig alle KI-Modelle evaluiere, um wettbewerbsfähig zu bleiben.
Deepseek schlägt ChatGPT in den App-Charts und setzt US-Chip-Aktien unter Druck
Besonders alarmierend für westliche KI-Labore: Deepseek bietet seine Cloud-API zu Preisen an, die 17- bis 27-mal günstiger sind als vergleichbare Angebote von OpenAI. Und: Nach dem enormen Erfolg von R1 schaffte es die Deepseek-App gar vor ChatGPT auf Platz 1 in den gesamten iPhone-Charts.
Auch die US-Chip-Aktien mit KI-Bezug wie Nvidia reagieren auf Deepseeks Effizienz und gaben über Nacht im einstelligen Prozentbereich nach. Die Erzählung ist hier, dass Deepseek gezeigt hat, dass man auch mit weniger Chips leistungsfähige und günstige KI-Modelle trainieren und betreiben kann.
Microsoft-CEO Satya Nadella nennt Deepseek zwar nicht beim Namen, veröffentlicht jedoch einen Tweet, der als Reaktion auf die aktuellen Entwicklungen gewertet werden kann: Der Microsoft-Chef verweist auf das Jevons-Paradoxon, das er in der KI für anwendbar hält.
Das Jevons-Paradox besagt, dass technologische Fortschritte, die die Effizienz bei der Nutzung einer Ressource erhöhen, zu einer Erhöhung der Nachfrage nach dieser Ressource führen können.
"Wenn KI effizienter und zugänglicher wird, werden wir einen sprunghaften Anstieg ihrer Nutzung erleben, der sie zu einer Ware macht, von der wir einfach nicht genug bekommen können", schreibt Nadella.