Huawei arbeitet an einem neuen KI-Prozessor und einem umfassenden Cloud-System, um die Dominanz von Nvidia im Bereich der KI-Infrastruktur herauszufordern. Technisch gelingt Huawei ein wichtiger Schritt – trotz erheblicher Einschränkungen durch US-Sanktionen.
Huawei Technologies testet derzeit einen neuen KI-Prozessor namens Ascend 910D, der künftig leistungsstärkere Produkte von Nvidia ersetzen soll. Laut dem Wall Street Journal plant Huawei, die ersten Muster des 910D noch im Mai 2025 zu erhalten. Der Chip soll leistungsfähiger sein als Nvidias H100, der seit 2022 als Industriestandard für KI-Training gilt und aktuell von den Nachfolgern der Blackwell-Generation im Westen ersetzt wird. Die leistungsfähigsten Chips von Nvidia dürfen nicht mehr nach China verkauft werden.
Im Vergleich zu Nvidias H100 ist der Ascend 910D jedoch weniger energieeffizient und besonders stromhungrig. Huawei setzt auf neue Packaging-Technologien, um mehrere Silizium-Dies miteinander zu verbinden und so die Leistung zu erhöhen, wie das Wall Street Journal berichtet. Die Entwicklung befindet sich noch in einem frühen Stadium; umfassende Tests sollen die Marktreife klären.
CloudMatrix 384: Huaweis Antwort auf Rack-Systeme von Nvidia
Parallel dazu stellte Huawei ein neues Rack-Scale-System namens CloudMatrix 384 vor, das noch auf dem Ascend 910C basiert. Das System vernetzt 384 dieser Chips. SemiAnalysis zufolge erreicht CloudMatrix 384 rund 300 PFLOPs an BF16-Compute-Leistung und übertrifft damit Nvidias GB200 NVL72-System nahezu um das Doppelte. Nvidia hatte kürzlich den Nachfolger GB300 NVL72 vorgestellt.
Bei der Speicherkapazität liegt Huaweis System mit 3,6-facher Aggregatkapazität und 2,1-facher Speicherbandbreite ebenfalls vorn. Allerdings benötigt CloudMatrix 384 dafür etwa 4,1-mal mehr Energie als Nvidias Vergleichssystem. Die Energieeffizienz pro FLOP fällt nach Angaben von SemiAnalysis ebenfalls um den Faktor 2,5 schlechter aus.
Ein zentrales Merkmal des CloudMatrix 384 ist die vollständige optische Vernetzung: Huawei verzichtet komplett auf Kupferkabel und setzt stattdessen auf 6.912 400G-Transceiver, wie SemiAnalysis schreibt. Jede der 384 GPUs nutzt sieben Transceiver für die interne Skalierung. Laut SeminAnalysis ähnelt die Architektur Konzepten, die Nvidia in der Vergangenheit aus Kostengründen verworfen hatte. Die Analysten sehen hier Huawei "eine Generation" vor Nvidia und AMD.
Abhängigkeit von ausländischer Produktion trotz Sanktionen
Trotz massiver US-Sanktionen blieb Huawei in der Chipfertigung bislang auf ausländische Zulieferer angewiesen. Laut SemiAnalysis wurden die bisher ausgelieferten Ascend 910B und 910C-Chips bei TSMC in Taiwan gefertigt. Huawei soll dafür Umgehungsgeschäfte über Drittfirmen wie Sophgo organisiert haben. TSMC droht demnach eine Strafe von bis zu einer Milliarde US-Dollar.
Für den Zugang zu High Bandwidth Memory (HBM) war Huawei ebenfalls auf ausländische Quellen angewiesen. SemiAnalysis zufolge bezog das Unternehmen große Mengen HBM-Stacks von Samsung und lagerte insgesamt rund 13 Millionen Einheiten ein. Trotz Exportkontrollen gelangte HBM über Zwischenstationen wie Faraday und CoAsia weiterhin nach China.
Chinas größter Chipfertiger SMIC baute laut SemiAnalysis seine 7-nm-Kapazitäten zwar aus, blieb aber hinsichtlich Ausbeute und Technologie hinter führenden Herstellern zurück. Dennoch könnten diese Kapazitäten mittelfristig wachsen, sofern Exportkontrollen nicht verschärft werden.
Systemebene wichtiger als Einzelchip-Leistung
Angesichts dieser strukturellen Engpässe verfolgt Huawei eine Strategie der Systemoptimierung: Statt einzelne Chips leistungsfähiger zu machen, setzt das Unternehmen auf die Skalierung großer, vernetzter Systeme. SemiAnalysis zufolge nutzt das CloudMatrix 384 Chinas Vorteil einer nahezu unbegrenzten Energieversorgung, um trotz hoher Leistungsaufnahme konkurrenzfähige KI-Infrastruktur bereitzustellen.
Das System liefere 70 Prozent mehr FLOPS als Nvidias aktuelles Rack, auch wenn die Energieeffizienz deutlich schlechter sei, so SemiAnalysis. In China gelte der zusätzliche Energiebedarf angesichts der politischen Priorität von technologischer Unabhängigkeit als akzeptabel.
Vor kurzem hatte Huawei bereits mit dem Mate 60-Smartphone demonstriert, dass es trotz US-Sanktionen in der Lage ist, eigene Hochleistungschips einzusetzen. Das Gerät nutzte einen in China gefertigten Prozessor.