Laut einem Fachartikel in „Nature“ hat das Training des R1-Sprachmodells des chinesischen KI-Unternehmens Deepseek lediglich 294.000 US-Dollar gekostet. Dabei kamen 512 speziell für den chinesischen Markt entwickelte Nvidia-H800-Chips zum Einsatz. Laut Nvidia hat das Unternehmen die Chips vor der Verkaufssperre erhalten. In Paper räumt Deepseek ein, in der Vorbereitungsphase für ein kleineres Modell zusätzlich A100-Chips verwendet zu haben. US-Behörden hatten zuvor vermutet, das Unternehmen verfüge über nicht genehmigte H100-Chips.
Die geringen Kosten blenden jedoch die Kosten für das zugrundeliegende Deepseek-V3-Modell aus. Allerdings sind auch diese stark umstritten und die Schätzungen schwanken je nach Quelle zwischen ein- und dreistelligen Millionenbeträgen. Die von Deepseek kommunizierten geringen Kosten hatten zu starken Kurseinbrüchen am Tech-Markt geführt.