Inhalt
summary Zusammenfassung

Forschende zeigen RoboGen, einen generativen Roboter-Agenten, der automatisiert neue Fähigkeiten in einer generativen Simulation lernt.

Die Arbeit von Forschenden der CMU, des Tsinghua IIIS, des MIT CSAIL, der UMass Amherst und des MIT-IBM AI Lab zielt darauf ab, die jüngsten Fortschritte in der generativen KI zu nutzen, um unendliche Trainingsdaten für das automatisierte Lernen von Robotern zu generieren.

RoboGen ist nach Angaben des Teams ein generativer Roboter-Agent, der verschiedene Roboteraufgaben automatisch und massenhaft durch generative Simulation lernt. Dabei nutzt das Team bestehende Foundation-Modelle wie OpenAIs GPT-4, um "verschiedene Aufgaben, Szenen und Trainingsüberwachungen automatisch zu generieren und so das Erlernen von Roboterfähigkeiten mit minimaler menschlicher Überwachung zu verbessern".

RoboGen nutzt GPT-4 für generative Simulation

Konkret hat RoboGen eine automatisierte Pipeline mit vier Schritten:

Anzeige
Anzeige

Task Proposal: RoboGen wählt zufällig ein Robotermodell und ein Objekt aus und verwendet GPT-4, um Aufgaben basierend auf diesen Informationen zu generieren.

Scene Generation: RoboGen erstellt Simulationsumgebungen für die vorgeschlagenen Aufgaben. Dazu werden 3D-Objekte aus dem Objaverse-Datensatz ausgewählt und von GPT-4 in realistische Anordnungen gebracht.

Training Supervision Generation: RoboGen verwendet anschließend GPT-4, um alle Aufgaben in kleine Schritte zu zerlegen. Diese Zerlegung führe zu weniger anspruchsvollen Aufgaben, die dann zum Beispiel von Algorithmen wie Reinforcement Learning gelöst werden könnten, so das Team. Nach diesem Schritt wählt GPT-4 für jede Aufgabe einen geeigneten Algorithmus aus.

Skill Learning: Sobald die Aufgabe, die Szene in der Simulationsumgebung, die einfacheren Aufgaben und die Algorithmen ausgewählt sind, wird die Szene und das Training in der Simulation gestartet.

Video: Wang, Xian, Chen et al.

Empfehlung

RoboGen soll weiterentwickelt werden

In einem ersten Test generiert RoboGen Trainingssimulationen für mehr als 100 verschiedene Aufgaben. Nach Angaben des Teams übertrifft der so generierte Datensatz bereits die von Menschen erstellten Datensätze. Allerdings zieht das Team in seiner Arbeit keinen Vergleich mit dem kürzlich vorgestellten Open-X Embodiment-Datensatz von Google Deepmind, der ebenfalls das allgemeine Lernen in der Robotik mit verschiedenen Robotertypen fördern soll.

Video: Wang, Xian, Chen et al.

Als Einschränkungen von RoboGen nennt das Team die noch fehlende Verifikation der gelernten Fähigkeiten, automatisierte Verfahren sollen aber in Zukunft integriert werden. Zudem bleibe die Realitätslücke weiter ein Problem - werde jedoch mit Forschungsfortschritten immer kleiner.

Alle Informationen, weitere Beispiele und der Code sind auf GitHub verfügbar.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Forschende präsentieren RoboGen, einen generativen Roboter-Agenten, der automatisiert neue Fähigkeiten in einer generativen Simulation lernt, indem er unendliche Trainingsdaten generiert.
  • RoboGen nutzt Foundation-Modelle wie OpenAIs GPT-4 in einer vierstufigen Pipeline, die Aufgaben generiert, Simulationsumgebungen erstellt, Trainingsüberwachungen aufteilt und schließlich Roboterfähigkeiten erlernt.
  • In ersten Tests hat RoboGen Trainingssimulationen für über 100 verschiedene Aufgaben generiert und menschlich erstellte Datensätze übertroffen. Zukünftige Verbesserungen sollen die Verifikation der gelernten Fähigkeiten umfassen.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!