Auf der SIGGRAPH 2025 stellt Nvidia eine Welle neuer Produkte vor, darunter kompakte Blackwell-GPUs, Enterprise-Server und fortschrittliche KI-Modelle. Ziel ist die Verschmelzung von Simulation und Realität für Robotik, autonome Systeme und intelligente Infrastrukturen.
Auf der Computergrafik-Konferenz SIGGRAPH 2025 hat Nvidia eine Reihe von Ankündigungen gemacht, die auf eine zentrale Vision einzahlen: die sogenannte "Physische KI" (Physical AI). Laut Nvidia beschreibt dieser Begriff die Konvergenz von künstlicher Intelligenz und Computergrafik, um Systeme zu schaffen, die in der realen Welt agieren können, etwa Roboter, autonome Fahrzeuge und intelligente Infrastrukturen.
"KI treibt unsere Simulationsfähigkeiten voran, und unsere Simulationsfähigkeiten treiben KI-Systeme voran", erklärte Sanja Fidler, Vice President of AI Research bei Nvidia. Das Unternehmen präsentierte ein umfassendes Ökosystem, das von neuer Hardware auf Basis der Blackwell-Architektur über Simulationsplattformen bis hin zu spezialisierten KI-Modellen für logisches Denken reicht.
Neue Blackwell-Hardware für KI in Workstations und Rechenzentren
Als Grundlage für rechenintensive KI-Workloads hat Nvidia neue Hardware vorgestellt. Für Rechenzentren kommt die Nvidia RTX PRO 6000 Blackwell Server Edition GPU in Mainstream-Enterprise-Server im weit verbreiteten 2U-Format. Systempartner wie Cisco, Dell Technologies, HPE, Lenovo und Supermicro sollen entsprechende Server anbieten. Laut Nvidia sollen diese Systeme den Übergang von traditionellen CPU-basierten Architekturen zu beschleunigten Computing-Plattformen vorantreiben. Das Unternehmen gibt an, dass die Server eine bis zu 45-mal höhere Leistung und eine 18-mal bessere Energieeffizienz als reine CPU-Systeme erreichen können. Die GPUs verfügen über Tensor Cores der fünften Generation mit Unterstützung für das FP4-Format, was die Inferenzleistung im Vergleich zur Vorgänger-GPU L40S versechsfachen soll.
Für den Desktop-Bereich wurden mit der Nvidia RTX PRO 4000 SFF Edition und der RTX PRO 2000 Blackwell zwei neue, kompakte Grafikkarten angekündigt. Diese sollen KI-Beschleunigung in kleineren, energieeffizienteren Formfaktoren für Bereiche wie Engineering, Design und 3D-Visualisierung ermöglichen. Im Vergleich zur Vorgängergeneration soll die RTX PRO 4000 SFF eine bis zu 2,5-mal höhere KI-Leistung bei gleichem Stromverbrauch von 70 Watt bieten. Die RTX PRO 2000 soll unter anderem eine um den Faktor 1,4 schnellere Leistung bei Computer-Aided Design (CAD) liefern. Die neuen GPUs sollen laut Nvidia später in diesem Jahr verfügbar sein.
Physische KI: Simulation als Schlüssel für die Robotik
Die neue Hardware soll die Rechenleistung für Nvidias Vision der Physischen KI bereitstellen. Der Kern des Konzepts ist die Erstellung hochrealistischer, physikalisch akkurater digitaler Zwillinge, in denen KI-Systeme wie Roboter sicher durch Versuch und Irrtum lernen können, bevor sie in der realen Welt eingesetzt werden. "Computergrafik und KI konvergieren, um die Robotik fundamental zu verändern", sagte Rev Lebaredian, Vice President of Omniverse and Simulation Technologies bei Nvidia.
Die technologische Basis dafür bilden die Plattformen Nvidia Omniverse und Isaac. Nvidia hat neue Softwarebibliotheken für Omniverse angekündigt, darunter Omniverse NuRec, das mithilfe von 3D Gaussian Splatting die Rekonstruktion von realen Umgebungen aus Sensordaten ermöglicht. Die Robotik-Simulationsanwendungen Isaac Sim 5.0 und Isaac Lab 2.2 sind nun als Open-Source-Projekte auf GitHub verfügbar und integrieren ebenfalls die neuen Rendering-Techniken.
Ein konkretes Anwendungsbeispiel liefert Amazon Devices & Services mit einem "Simulation-first"-Ansatz für eine sogenannte "Zero-Touch"-Fertigung. Dabei werden CAD-Modelle neuer Produkte in Nvidia Isaac Sim geladen, um mehr als 50.000 synthetische Bilder für das Training von KI-Modellen zu generieren. Diese Modelle steuern dann Roboterarme, die autonom Qualitätsprüfungen durchführen oder neue Produkte in die Fertigungslinie integrieren – rein auf Basis von in der Simulation gelernten Fähigkeiten und ohne physische Hardware-Anpassungen. Technologien wie das Posen-Schätzungsmodell FoundationPose ermöglichen es den Robotern, auch neue Objekte ohne vorheriges Training zu erkennen.
Parallel zu klassischen simulationsbasierten Ansätzen in Ominiverse entwickelt Nvidia auch World-Foundation-Modelle mit der Cosmos-Reihe. Eine besonders beeindruckende Variante solcher Modelle zeigte kürzlich Google Deepmind mit Genie 3.
Neue KI-Modelle sollen logisches Denken ermöglichen
Damit KI-Systeme nicht nur wahrnehmen, sondern auch schlussfolgern können, hat Nvidia erweiterte KI-Modellfamilien für "Reasoning" (logisches Denken) vorgestellt. Für Unternehmensanwendungen wurde die Nemotron-Familie um die Modelle Nemotron Nano 2 und Llama Nemotron Super 1.5 erweitert. Diese sollen KI-Agenten ermöglichen, mehrstufige Aufgaben in Bereichen wie Kundenservice oder Cybersicherheit zu bewältigen. Laut Nvidia bieten die Modelle durch eine hybride Architektur und Quantisierung (NVFP4) eine hohe Effizienz. Unternehmen wie CrowdStrike, Uber und Zoom sollen die Modelle bereits testen oder deren Einsatz planen.
Speziell für die Physische KI wurde Cosmos Reason entwickelt, ein anpassbares Vision-Language-Model (VLM) mit 7 Milliarden Parametern. Es soll Robotern und Vision-KI-Agenten ermöglichen, die physische Welt unter Einbeziehung von Vorwissen, Physikverständnis und "Common Sense" zu interpretieren und darin zu handeln. Anwendungsbereiche sind die Roboterplanung, die automatisierte Annotation von Trainingsdaten und die Videoanalyse. Partner wie Uber nutzen das Modell laut Nvidia zur Analyse des Verhaltens autonomer Fahrzeuge, während VAST Data und Milestone Systems es für die intelligente Verkehrsüberwachung einsetzen.
Smarte Städte und Fabriken mit der Metropolis-Plattform
Um diese Technologien in konkrete Anwendungen für intelligente Infrastrukturen zu überführen, bündelt Nvidia viele der Komponenten in der Nvidia Metropolis-Plattform. Diese wurde um mehrere Funktionen erweitert, darunter die Integration des Cosmos Reason VLM, neue Vision-Foundation-Models im TAO Toolkit und Erweiterungen für Isaac Sim zur Generierung seltener Trainingsszenarien.
Partner nutzen die Plattform bereits für verschiedene Lösungen. Accenture und Belden entwickeln "intelligente virtuelle Zäune", die in Omniverse simuliert werden, um die Sicherheit von Arbeitern in der Nähe von Industrierobotern zu erhöhen. Das Unternehmen DeepHow setzt den Metropolis VSS-Blueprint für einen "Smart Know-How Companion" ein, der Arbeitsanweisungen in visuelle Anleitungen umwandelt. Der Getränkehersteller Anheuser-Busch InBev soll damit die Einarbeitungszeit neuer Mitarbeiter um 80 Prozent reduziert haben.