Inhalt
summary Zusammenfassung

Huawei arbeitet an einem neuen KI-Prozessor und einem umfassenden Cloud-System, um die Dominanz von Nvidia im Bereich der KI-Infrastruktur herauszufordern. Technisch gelingt Huawei ein wichtiger Schritt – trotz erheblicher Einschränkungen durch US-Sanktionen.

Anzeige

Huawei Technologies testet derzeit einen neuen KI-Prozessor namens Ascend 910D, der künftig leistungsstärkere Produkte von Nvidia ersetzen soll. Laut dem Wall Street Journal plant Huawei, die ersten Muster des 910D noch im Mai 2025 zu erhalten. Der Chip soll leistungsfähiger sein als Nvidias H100, der seit 2022 als Industriestandard für KI-Training gilt und aktuell von den Nachfolgern der Blackwell-Generation im Westen ersetzt wird. Die leistungsfähigsten Chips von Nvidia dürfen nicht mehr nach China verkauft werden.

Im Vergleich zu Nvidias H100 ist der Ascend 910D jedoch weniger energieeffizient und besonders stromhungrig. Huawei setzt auf neue Packaging-Technologien, um mehrere Silizium-Dies miteinander zu verbinden und so die Leistung zu erhöhen, wie das Wall Street Journal berichtet. Die Entwicklung befindet sich noch in einem frühen Stadium; umfassende Tests sollen die Marktreife klären.

CloudMatrix 384: Huaweis Antwort auf Rack-Systeme von Nvidia

Parallel dazu stellte Huawei ein neues Rack-Scale-System namens CloudMatrix 384 vor, das noch auf dem Ascend 910C basiert. Das System vernetzt 384 dieser Chips. SemiAnalysis zufolge erreicht CloudMatrix 384 rund 300 PFLOPs an BF16-Compute-Leistung und übertrifft damit Nvidias GB200 NVL72-System nahezu um das Doppelte. Nvidia hatte kürzlich den Nachfolger GB300 NVL72 vorgestellt.

Anzeige
Anzeige

Bei der Speicherkapazität liegt Huaweis System mit 3,6-facher Aggregatkapazität und 2,1-facher Speicherbandbreite ebenfalls vorn. Allerdings benötigt CloudMatrix 384 dafür etwa 4,1-mal mehr Energie als Nvidias Vergleichssystem. Die Energieeffizienz pro FLOP fällt nach Angaben von SemiAnalysis ebenfalls um den Faktor 2,5 schlechter aus.

Ein zentrales Merkmal des CloudMatrix 384 ist die vollständige optische Vernetzung: Huawei verzichtet komplett auf Kupferkabel und setzt stattdessen auf 6.912 400G-Transceiver, wie SemiAnalysis schreibt. Jede der 384 GPUs nutzt sieben Transceiver für die interne Skalierung. Laut SeminAnalysis ähnelt die Architektur Konzepten, die Nvidia in der Vergangenheit aus Kostengründen verworfen hatte. Die Analysten sehen hier Huawei "eine Generation" vor Nvidia und AMD.

Abhängigkeit von ausländischer Produktion trotz Sanktionen

Trotz massiver US-Sanktionen blieb Huawei in der Chipfertigung bislang auf ausländische Zulieferer angewiesen. Laut SemiAnalysis wurden die bisher ausgelieferten Ascend 910B und 910C-Chips bei TSMC in Taiwan gefertigt. Huawei soll dafür Umgehungsgeschäfte über Drittfirmen wie Sophgo organisiert haben. TSMC droht demnach eine Strafe von bis zu einer Milliarde US-Dollar.

Für den Zugang zu High Bandwidth Memory (HBM) war Huawei ebenfalls auf ausländische Quellen angewiesen. SemiAnalysis zufolge bezog das Unternehmen große Mengen HBM-Stacks von Samsung und lagerte insgesamt rund 13 Millionen Einheiten ein. Trotz Exportkontrollen gelangte HBM über Zwischenstationen wie Faraday und CoAsia weiterhin nach China.

Chinas größter Chipfertiger SMIC baute laut SemiAnalysis seine 7-nm-Kapazitäten zwar aus, blieb aber hinsichtlich Ausbeute und Technologie hinter führenden Herstellern zurück. Dennoch könnten diese Kapazitäten mittelfristig wachsen, sofern Exportkontrollen nicht verschärft werden.

Empfehlung

Systemebene wichtiger als Einzelchip-Leistung

Angesichts dieser strukturellen Engpässe verfolgt Huawei eine Strategie der Systemoptimierung: Statt einzelne Chips leistungsfähiger zu machen, setzt das Unternehmen auf die Skalierung großer, vernetzter Systeme. SemiAnalysis zufolge nutzt das CloudMatrix 384 Chinas Vorteil einer nahezu unbegrenzten Energieversorgung, um trotz hoher Leistungsaufnahme konkurrenzfähige KI-Infrastruktur bereitzustellen.

Das System liefere 70 Prozent mehr FLOPS als Nvidias aktuelles Rack, auch wenn die Energieeffizienz deutlich schlechter sei, so SemiAnalysis. In China gelte der zusätzliche Energiebedarf angesichts der politischen Priorität von technologischer Unabhängigkeit als akzeptabel.

Vor kurzem hatte Huawei bereits mit dem Mate 60-Smartphone demonstriert, dass es trotz US-Sanktionen in der Lage ist, eigene Hochleistungschips einzusetzen. Das Gerät nutzte einen in China gefertigten Prozessor.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Huawei testet derzeit den neuen KI-Prozessor Ascend 910D, der leistungsfähiger als Nvidias H100 sein soll, jedoch deutlich mehr Energie verbraucht und sich noch in der Frühphase der Entwicklung befindet.
  • Mit dem Rack-Scale-System CloudMatrix 384 vernetzt Huawei 384 Ascend-910C-Chips vollständig optisch und erreicht damit fast doppelt so viel Rechenleistung wie Nvidias aktuelles NVL72-System – bei allerdings 4,1-fach höherem Energieverbrauch.
  • Trotz US-Sanktionen bleibt Huawei auf ausländische Fertigung und Speicherlieferungen angewiesen, setzt jedoch zunehmend auf großskalige Systeme, um durch schiere Größe und verfügbare Energie wettbewerbsfähig zu bleiben.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!