DeepSeek: Chinas KI-Modell R1 kostete nur 294.000 Dollar im Training
Laut einem Fachartikel in „Nature“ hat das Training des R1-Sprachmodells des chinesischen KI-Unternehmens Deepseek lediglich 294.000 US-Dollar gekostet. Dabei kamen 512 speziell für den chinesischen Markt entwickelte Nvidia-H800-Chips zum Einsatz. Laut Nvidia hat das Unternehmen die Chips vor der Verkaufssperre erhalten. In Paper räumt Deepseek ein, in der Vorbereitungsphase für ein kleineres Modell zusätzlich A100-Chips verwendet zu haben. US-Behörden hatten zuvor vermutet, das Unternehmen verfüge über nicht genehmigte H100-Chips.
Die geringen Kosten blenden jedoch die Kosten für das zugrundeliegende Deepseek-V3-Modell aus. Allerdings sind auch diese stark umstritten und die Schätzungen schwanken je nach Quelle zwischen ein- und dreistelligen Millionenbeträgen. Die von Deepseek kommunizierten geringen Kosten hatten zu starken Kurseinbrüchen am Tech-Markt geführt.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnieren