Nvidia-Team entwickelt Mini-KI-Modell für humanoide Robotersteuerung

NVIDIA-Forscher haben ein kompaktes neuronales Netzwerk entwickelt, das humanoide Roboter über verschiedene Eingabemethoden steuern kann. Das System übertrifft dabei sogar spezialisierte Steuerungssysteme.

Das HOVER getaufte System kommt mit nur 1,5 Millionen Parametern aus und kann laut Nvidia dennoch komplexe Bewegungen humanoider Roboter steuern. Zum Vergleich: Große Sprachmodelle arbeiten oft mit Hunderten Milliarden Parametern.

Das System wurde in Nvidias GPU-beschleunigter Simulationsumgebung Isaac trainiert, in der Roboterbewegungen um den Faktor 10.000 beschleunigt werden können. Nach Angaben von Nvidia-Forscher Jim Fan entspricht ein Jahr intensiven Trainings in dieser virtuellen "Trainingsarena" nur etwa 50 Minuten realer Rechenzeit auf einer einzigen GPU.

Nach Angaben der Forscher kann HOVER ohne weitere Anpassungen direkt von der Simulation auf reale Roboter übertragen werden. Das System unterstützt verschiedene Steuerungsmodi: Es kann Kopf- und Handbewegungen von XR-Geräten wie der Apple Vision Pro verarbeiten, Ganzkörperposen über Motion Capture oder RGB-Kameras erfassen sowie Gelenkwinkel von Exoskeletten übernehmen. Auch die direkte Steuerung über Joysticks ist möglich.

Das Hover-Modell ermöglicht die Fernsteuerung eines Roboters über eine VR-Brille ohne spezielles Fein-Tuning. | Video: Nvidia

Generalist schlägt Spezialisten

Überraschenderweise übertrifft HOVER als Generalist die Leistung von Systemen, die speziell für einzelne Steuerungsmodi entwickelt wurden. Die Nvidia-Forscher vermuten, dass geteiltes physikalisches Wissen wie Gleichgewicht und präzise Gliedmaßensteuerung die Generalisierung über alle Steuerungsmodi hinweg verbessert.

Das vom NVIDIA GEAR Lab entwickelte System basiert auf dem Open-Source-Projekt H2O & OmniH2O und unterstützt jeden humanoiden Roboter, der in der Isaac-Umgebung simuliert werden kann. Weitere Beispiele und der Code sind auf GitHub verfügbar.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Nvidia-Team entwickelt Mini-KI-Modell für humanoide Robotersteuerung

Generalist schlägt Spezialisten

Nvidia treibt mit neuer Blackwell-Hardware und KI-Modellen die "Physische KI" voran

Trump-Regierung verlangt Umsatzbeteiligung für KI-Chip-Exporte nach China

Nvidia-Forschende plädieren für mehr kleine Modelle in KI-Agenten

OpenAI startet GPT-5 – mit besserem Verständnis, Personalisierung und Entwickler-Tools

Google Deepmind zeigt mit Genie 3 ein KI-Modell für interaktive Welten in Echtzeit

Google schaltet Gemini 2.5 Deep Think frei – und zieht erste Sicherheitsgrenzen

Nvidia-Team entwickelt Mini-KI-Modell für humanoide Robotersteuerung

Generalist schlägt Spezialisten

Nvidia treibt mit neuer Blackwell-Hardware und KI-Modellen die "Physische KI" voran

Trump-Regierung verlangt Umsatzbeteiligung für KI-Chip-Exporte nach China

Nvidia-Forschende plädieren für mehr kleine Modelle in KI-Agenten