Inhalt
summary Zusammenfassung

Mit einem neuen Datensatz wollen Deepmind und zahlreiche andere Institutionen die Datenlücke beim Training von Robotern schließen und eine Verallgemeinerung von Roboterfähigkeiten über Robotertypen hinweg ermöglichen. Erste Ergebnisse sind vielversprechend.

Google Deepmind hat in Zusammenarbeit mit 33 akademischen Labors einen neuen Datensatz und neue Modelle veröffentlicht, die das allgemeine Lernen in der Robotik über verschiedene Robotertypen hinweg fördern sollen.

Die Daten stammen von 22 verschiedenen Robotertypen. Ziel ist es, Robotermodelle zu entwickeln, die ihre Fähigkeiten über verschiedene Robotertypen hinweg besser verallgemeinern können.

Auf dem Weg zum Allzweckroboter

Bisher musste für jede Aufgabe, jeden Roboter und jede Umgebung ein eigenes Robotermodell trainiert werden. Das stellt hohe Anforderungen an die Datensammlung. Zudem musste bei der kleinsten Änderung einer Variablen der Prozess von vorn beginnen, schreibt Deepmind.

Anzeige
Anzeige

Ziel der Open-X Initiative sei es, einen Weg zu finden, das Wissen über verschiedene Roboter (Embodiments) zu bündeln und einen universellen Roboter zu trainieren. Diese Idee führte zur Entwicklung des Open-X Embodiment-Datensatzes und von RT-1-X, einem Robotertransformermodell, das von RT-1 abgeleitet und mit dem neuen Datensatz trainiert wurde.

Tests in fünf verschiedenen Forschungslabors ergaben eine durchschnittliche Steigerung der Erfolgsrate bei der Ausführung von Aufgaben um 50 Prozent, wenn RT-1-X die Steuerung von fünf verschiedenen, häufig verwendeten Robotern übernahm. Als Vergleich dienten die spezifischen Steuerungsmodelle der Roboter.

Bild: Deepmind

Ein Datensatz für universelles Robotertraining

Der Open X-Embodiment-Datensatz wurde in Zusammenarbeit mit akademischen Forschungslabors aus mehr als 20 Institutionen entwickelt. Er fasst die Daten von 22 Robotern zusammen, die mehr als 500 Fähigkeiten und 150.000 Aufgaben in mehr als einer Million Arbeitsabläufen demonstrieren.

Der Datensatz sei ein wichtiges Werkzeug, um ein generalistisches Modell zu trainieren, das in der Lage sei, viele verschiedene Arten von Robotern zu steuern, unterschiedliche Anweisungen zu interpretieren, grundlegende Überlegungen zu komplexen Aufgaben anzustellen und effizient zu verallgemeinern, schreibt Deepmind.

Emergente Fähigkeiten im Robotermodell

Das im Sommer vorgestellte visuelle Sprachaktionsmodell RT-2 in der Version RT-2-X verdreifachte seine Fähigkeiten als Roboter in der realen Welt, nachdem es mit dem Open-X-Datensatz trainiert worden war. Die Experimente zeigten, dass das Co-Training mit Daten von anderen Plattformen RT-2-X mit zusätzlichen Fähigkeiten ausstattete, die im ursprünglichen RT-2-Datensatz nicht vorhanden waren.

Empfehlung

Das RT-2-Modell verwendet große Sprachmodelle für logisches Denken oder Schlussfolgerungen als Grundlage für Handlungen. Zum Beispiel kann es begründen, warum ein Stein ein besserer improvisierter Hammer ist als ein Stück Papier, und diese Fähigkeit auf verschiedene Anwendungsszenarien anwenden.

Nach dem Training mit dem X-Datensatz konnte es diese Fähigkeiten noch verbessern. RT-2-X zeigte beispielsweise ein besseres Verständnis für räumliche Beziehungen zwischen Objekten, indem es feine Abstufungen wie "lege den Apfel auf das Tuch" oder "lege den Apfel in die Nähe des Tuchs" unterscheiden konnte.

Bild: Deepmind

RT-2-X zeige, dass das Training mit Daten anderer Roboter auch bereits fähige Roboter, die mit vielen Daten trainiert wurden, weiter verbessern könne, schreibt Deepmind.

Das Fazit des Forscherteams fällt ähnlich aus: Die Skalierung der Roboterfähigkeiten anhand von Daten verschiedener Robotertypen funktioniere und bringe "dramatische Leistungsverbesserungen". Zukünftige Forschung könnte sich damit beschäftigen, wie Robotermodelle besser aus Erfahrungen lernen können.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Deepmind und 33 akademische Labors haben den Open-X Embodiment-Datensatz entwickelt, um das allgemeine Lernen in der Robotik mit verschiedenen Robotertypen zu fördern und universellere Fähigkeiten zu trainieren.
  • Das Robotermodell RT-1-X, das mit dem neuen Datensatz trainiert wurde, zeigte bei der Ausführung von Aufgaben mit fünf verschiedenen Robotern eine durchschnittliche Steigerung der Erfolgsrate um 50 Prozent.
  • RT-2-X, eine erweiterte Version des visuellen Sprachaktionsmodells RT-2, verdreifachte nach dem Training mit dem Open-X-Datensatz seine Fähigkeiten als Roboter in der realen Welt und zeigte ein besseres Verständnis der räumlichen Beziehungen zwischen Objekten.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!