Inhalt
summary Zusammenfassung

Ein Team der Purdue University hat eine neue Technik namens UniT vorgestellt, die es Robotern ermöglicht, Berührungsinformationen besser zu verarbeiten und auf verschiedene Aufgaben zu übertragen.

Anzeige

Wissenschaftler der Purdue University haben eine Methode entwickelt, die Robotern eine effizientere Verarbeitung taktiler Informationen ermöglicht. Die als UniT (Unified Tactile Representation) bezeichnete Technik nutzt ein spezielles maschinelles Lernverfahren, um aus einfachen Berührungsdaten eine vielseitig einsetzbare Repräsentation zu erstellen.

Ziel ist es, Robotern neben visuellen Informationen auch den Tastsinn zu vermitteln, ähnlich wie Menschen ihn zur Interaktion mit Objekten nutzen. Das Besondere an UniT: Die taktile Repräsentation kann mit Daten von nur einem einfachen Objekt trainiert werden. In den Experimenten verwendeten die Forscher dafür einen Inbusschlüssel oder eine kleine Kugel.

 

Anzeige
Anzeige

Video: Xu, Uppuluri et al.

Zur Erfassung der taktilen Daten kam ein GelSight-Sensor zum Einsatz. Dieser besteht aus einem elastischen Gel mit eingebetteten Markern, das sich bei Berührung verformt. Eine Kamera nimmt diese Verformungen auf. Diese Bilder zeigen, wie das Objekt gedrückt oder bewegt wird, und geben so Informationen über Form, Position und die Kräfte, die auf das Objekt wirken.

Die Forscher nutzen dann ein VQVAE, um die Informationen aus den taktilen Bildern in kompakter Form zu speichern. Dies ermöglicht dem Roboter, effizient zu lernen und die Fähigkeiten auf verschiedene Aufgaben anzuwenden.

UniT verbessert Roboterleistung deutlich

In Experimenten zeigte sich, dass die mit UniT erlernte Repräsentation gut auf unbekannte Objekte übertragen werden konnte. So ließen sich beispielsweise die Kontaktgeometrie und Kraftverteilung bei der Berührung verschiedener Gegenstände rekonstruieren, obwohl das System nur mit einem einfachen Objekt trainiert wurde.

UniT ermöglicht es dem Roboter auch, ohne zusätzliches Training verschiedene Aufgaben zu bewältigen, wie die Position eines USB-Steckers zu erkennen oder Gegenstände präzise zu greifen. Dabei zeigt UniT bessere Ergebnisse als frühere Methoden, die nur auf visuelle Informationen setzen oder den Tastsinn wie eine zusätzliche Kamera behandeln.

Empfehlung

Video: Xu, Uppuluri et al.

Die Forscher demonstrierten die Leistungsfähigkeit von UniT anhand mehrerer robotischer Aufgaben. Bei der 3D-Posenschätzung eines USB-Steckers übertraf die Methode andere Ansätze deutlich. Auch in Manipulationsaufgaben wie dem Aufhängen von Hühnchenbeinen oder dem Greifen zerbrechlicher Chips zeigte sich die Überlegenheit der UniT-basierten Steuerung.

Video: Xu, Uppuluri et al.

Video: Xu, Uppuluri et al.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Die Forscher sehen noch Potenzial für Weiterentwicklungen. So könnte die Methode in Zukunft auf weiche Objekte ausgeweitet oder um physikalische Modelle ergänzt werden.

Mehr Informationen und den Code gibt es auf GitHub.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Forscher der Purdue University haben UniT entwickelt, eine Technik zur effizienteren Verarbeitung taktiler Informationen für Roboter. UniT nutzt maschinelles Lernen, um aus einfachen Berührungsdaten vielseitig einsetzbare Repräsentationen zu erstellen.
  • Zur Datenerfassung dient ein GelSight-Sensor mit elastischem Gel und eingebetteten Markern. Eine Kamera nimmt Verformungen bei Berührung auf. Ein VQVAE speichert die Informationen kompakt, was effizientes Lernen und Übertragung auf verschiedene Aufgaben ermöglicht.
  • In Experimenten zeigte UniT bessere Ergebnisse als frühere Methoden bei Aufgaben wie 3D-Posenschätzung eines USB-Steckers oder Greifen zerbrechlicher Objekte. Die Forscher sehen Potenzial für Weiterentwicklungen, etwa bei weichen Objekten oder der Integration physikalischer Modelle.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!