Inhalt
summary Zusammenfassung

NVIDIA-Forscher haben ein kompaktes neuronales Netzwerk entwickelt, das humanoide Roboter über verschiedene Eingabemethoden steuern kann. Das System übertrifft dabei sogar spezialisierte Steuerungssysteme.

Anzeige

Das HOVER getaufte System kommt mit nur 1,5 Millionen Parametern aus und kann laut Nvidia dennoch komplexe Bewegungen humanoider Roboter steuern. Zum Vergleich: Große Sprachmodelle arbeiten oft mit Hunderten Milliarden Parametern.

Das System wurde in Nvidias GPU-beschleunigter Simulationsumgebung Isaac trainiert, in der Roboterbewegungen um den Faktor 10.000 beschleunigt werden können. Nach Angaben von Nvidia-Forscher Jim Fan entspricht ein Jahr intensiven Trainings in dieser virtuellen "Trainingsarena" nur etwa 50 Minuten realer Rechenzeit auf einer einzigen GPU.

Nach Angaben der Forscher kann HOVER ohne weitere Anpassungen direkt von der Simulation auf reale Roboter übertragen werden. Das System unterstützt verschiedene Steuerungsmodi: Es kann Kopf- und Handbewegungen von XR-Geräten wie der Apple Vision Pro verarbeiten, Ganzkörperposen über Motion Capture oder RGB-Kameras erfassen sowie Gelenkwinkel von Exoskeletten übernehmen. Auch die direkte Steuerung über Joysticks ist möglich.

Anzeige
Anzeige

Das Hover-Modell ermöglicht die Fernsteuerung eines Roboters über eine VR-Brille ohne spezielles Fein-Tuning. | Video: Nvidia

Generalist schlägt Spezialisten

Überraschenderweise übertrifft HOVER als Generalist die Leistung von Systemen, die speziell für einzelne Steuerungsmodi entwickelt wurden. Die Nvidia-Forscher vermuten, dass geteiltes physikalisches Wissen wie Gleichgewicht und präzise Gliedmaßensteuerung die Generalisierung über alle Steuerungsmodi hinweg verbessert.

Das vom NVIDIA GEAR Lab entwickelte System basiert auf dem Open-Source-Projekt H2O & OmniH2O und unterstützt jeden humanoiden Roboter, der in der Isaac-Umgebung simuliert werden kann. Weitere Beispiele und der Code sind auf GitHub verfügbar.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Forscher von Nvidia haben ein kompaktes neuronales Netzwerk namens HOVER entwickelt, das komplexe Bewegungen humanoider Roboter mit nur 1,5 Millionen Parametern steuern kann.
  • Das System wurde in Nvidias GPU-beschleunigter Simulationsumgebung Isaac trainiert, in der ein Jahr intensives Training nur etwa 50 Minuten echter Rechenzeit auf einer GPU entspricht. Laut Nvidia kann HOVER ohne weitere Anpassungen direkt von der Simulation auf reale Roboter übertragen werden.
  • HOVER unterstützt verschiedene Steuerungsmodi wie Kopf- und Handbewegungen von XR-Geräten, Ganzkörperposen über Motion Capture oder Kameras sowie Gelenkwinkel von Exoskeletten.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!