Forschende zeigen RoboGen, einen generativen Roboter-Agenten, der automatisiert neue Fähigkeiten in einer generativen Simulation lernt.
Die Arbeit von Forschenden der CMU, des Tsinghua IIIS, des MIT CSAIL, der UMass Amherst und des MIT-IBM AI Lab zielt darauf ab, die jüngsten Fortschritte in der generativen KI zu nutzen, um unendliche Trainingsdaten für das automatisierte Lernen von Robotern zu generieren.
RoboGen ist nach Angaben des Teams ein generativer Roboter-Agent, der verschiedene Roboteraufgaben automatisch und massenhaft durch generative Simulation lernt. Dabei nutzt das Team bestehende Foundation-Modelle wie OpenAIs GPT-4, um "verschiedene Aufgaben, Szenen und Trainingsüberwachungen automatisch zu generieren und so das Erlernen von Roboterfähigkeiten mit minimaler menschlicher Überwachung zu verbessern".
RoboGen nutzt GPT-4 für generative Simulation
Konkret hat RoboGen eine automatisierte Pipeline mit vier Schritten:
Task Proposal: RoboGen wählt zufällig ein Robotermodell und ein Objekt aus und verwendet GPT-4, um Aufgaben basierend auf diesen Informationen zu generieren.
Scene Generation: RoboGen erstellt Simulationsumgebungen für die vorgeschlagenen Aufgaben. Dazu werden 3D-Objekte aus dem Objaverse-Datensatz ausgewählt und von GPT-4 in realistische Anordnungen gebracht.
Training Supervision Generation: RoboGen verwendet anschließend GPT-4, um alle Aufgaben in kleine Schritte zu zerlegen. Diese Zerlegung führe zu weniger anspruchsvollen Aufgaben, die dann zum Beispiel von Algorithmen wie Reinforcement Learning gelöst werden könnten, so das Team. Nach diesem Schritt wählt GPT-4 für jede Aufgabe einen geeigneten Algorithmus aus.
Skill Learning: Sobald die Aufgabe, die Szene in der Simulationsumgebung, die einfacheren Aufgaben und die Algorithmen ausgewählt sind, wird die Szene und das Training in der Simulation gestartet.
RoboGen soll weiterentwickelt werden
In einem ersten Test generiert RoboGen Trainingssimulationen für mehr als 100 verschiedene Aufgaben. Nach Angaben des Teams übertrifft der so generierte Datensatz bereits die von Menschen erstellten Datensätze. Allerdings zieht das Team in seiner Arbeit keinen Vergleich mit dem kürzlich vorgestellten Open-X Embodiment-Datensatz von Google Deepmind, der ebenfalls das allgemeine Lernen in der Robotik mit verschiedenen Robotertypen fördern soll.
Als Einschränkungen von RoboGen nennt das Team die noch fehlende Verifikation der gelernten Fähigkeiten, automatisierte Verfahren sollen aber in Zukunft integriert werden. Zudem bleibe die Realitätslücke weiter ein Problem - werde jedoch mit Forschungsfortschritten immer kleiner.
Alle Informationen, weitere Beispiele und der Code sind auf GitHub verfügbar.