Eine fünfmonatige Untersuchung von SemiAnalysis zeigt: AMDs neue MI300X-KI-Chips können ihr Potenzial wegen gravierender Software-Probleme nicht ausschöpfen. Der Vorsprung von Nvidia bleibt bestehen.
Auf dem Papier sieht AMDs neuer KI-Beschleuniger MI300X wie ein ernst zu nehmender Konkurrent für Nvidias dominante H100- und H200-Chips aus.
Doch eine umfassende Analyse von SemiAnalysis zeigt nun: Die Software-Probleme bei AMD sind so gravierend, dass der Chip-Hersteller gegen Nvidia keine Chance hat.
Wie die Analysten in ihrer fünfmonatigen Untersuchung feststellten, ist die AMD-Software von Bugs durchsetzt und macht ein Training von KI-Modellen "out of the box" praktisch unmöglich. Die Tests umfassten unter anderem GEMM-Benchmarks und Einzelknoten-Trainings.
Der "CUDA-Graben" sei für AMD aufgrund der schwachen Qualitätssicherung (QA) und der schwierigen "Out-of-the-Box"-Erfahrung weiterhin nicht überwindbar. Nvidia hingegen verstärke diesen Graben kontinuierlich mit neuen Funktionen, Bibliotheken und Leistungsupdates.
Theoretische Vorteile werden nicht genutzt
Laut SemiAnalysis bietet der MI300X mit 1.307 TeraFLOPS bei FP16-Berechnungen und 192 GB HBM3-Speicher auf dem Papier bessere Spezifikationen als Nvidias H100 mit 989 TeraFLOPS und 80 GB Speicher.
Auch die Gesamtbetriebskosten (TCO) liegen aufgrund der niedrigeren Preise und der Verwendung von günstigeren Ethernet-Netzwerken bei AMD-Systemen deutlich niedriger. Die Analysten betonen, dass AMD mit dem MI300X eine starke Basis für zukünftige Erfolge hat.
Diese theoretischen Vorteile würden jedoch durch die massive Software-Problematik zunichtegemacht. Die Analysten mussten zahlreiche Bugs beheben und eng mit AMD-Ingenieuren zusammenarbeiten, um überhaupt brauchbare Benchmark-Ergebnisse zu erzielen. Bei Nvidia-Systemen sei dagegen alles "out of the box" problemlos gelaufen.
Empfehlungen an AMD-Chefin Lisa Su
Die Analysten formulieren klare Empfehlungen an AMD-CEO Lisa Su: Das Unternehmen müsse dringend mehr Ressourcen in Software-Entwicklung und -Tests investieren. Unter anderem sollten tausende MI300X-Chips für automatisierte Tests bereitgestellt werden - so wie es Nvidia bereits tue.
Auch sollte AMD die Abhängigkeit von komplexen Umgebungsvariablen reduzieren und stattdessen vernünftige Standardeinstellungen implementieren. "Macht die Out-of-Box-Erfahrung endlich nutzbar!", fordern die Experten von SemiAnalysis.
Die Analysten von SemiAnalysis betonen, dass sie AMD als Wettbewerber zu Nvidia sehen wollen, aber aktuell sehe es schlecht aus. "Es gibt noch viel zu tun", heißt es in dem Bericht.
Sollte sich an AMDs Software-Situation nichts ändern, dürfte Nvidia seine dominante Marktposition im KI-Chip-Segment weiter behaupten und ausbauen. Nvidias neue Chip-Generation Blackwell steht schon in den Startlöchern.