Laut einem Fachartikel in „Nature“ hat das Training des R1-Sprachmodells des chinesischen KI-Unternehmens Deepseek lediglich 294.000 US-Dollar gekostet. Dabei kamen 512 speziell für den chinesischen Markt entwickelte Nvidia-H800-Chips zum Einsatz. Laut Nvidia hat das Unternehmen die Chips vor der Verkaufssperre erhalten. In Paper räumt Deepseek ein, in der Vorbereitungsphase für ein kleineres Modell zusätzlich A100-Chips verwendet zu haben. US-Behörden hatten zuvor vermutet, das Unternehmen verfüge über nicht genehmigte H100-Chips.

Anzeige

Die geringen Kosten blenden jedoch die Kosten für das zugrundeliegende Deepseek-V3-Modell aus. Allerdings sind auch diese stark umstritten und die Schätzungen schwanken je nach Quelle zwischen ein- und dreistelligen Millionenbeträgen. Die von Deepseek kommunizierten geringen Kosten hatten zu starken Kurseinbrüchen am Tech-Markt geführt.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!