Inhalt
summary Zusammenfassung

Das Startup Figure hat mit Helix ein KI-System vorgestellt, das humanoiden Robotern ermöglicht, komplexe Bewegungen durch Sprachbefehle auszuführen. Das System soll ohne spezifisches Training neue Objekte handhaben können.

Anzeige

Das Startup Figure hat ein neues KI-System namens Helix entwickelt. Laut dem Unternehmen handelt es sich um ein Vision-Language-Action (VLA) Modell, das den Oberkörper eines humanoiden Roboters in Echtzeit steuern soll.

Das System basiert auf zwei Komponenten: Ein multimodales Sprachmodell mit 7 Milliarden Parametern verarbeitet Sprache und visuelle Informationen mit 7-9 Hz und dient als "Gehirn". Eine zweite KI mit 80 Millionen Parametern übersetzt die vom Sprachmodell weitergegebenen Anweisungen in Roboterbewegungen mit 200 Hz.

Bild: Figure AI

Steuerung von 35 Bewegungsachsen

Das System soll 35 Freiheitsgrade gleichzeitig kontrollieren können - von Fingerbewegungen bis zur Kopf- und Torsosteuerung. In Demonstrationsvideos zeigt Figure, wie Roboter auf Sprachbefehle reagieren und entsprechende Objekte identifizieren und greifen.

Anzeige
Anzeige

In einem weiteren Test lässt Figure zwei Roboter zusammenarbeiten, die gemeinsam Lebensmittel in einer Show-Küche etwa in einen Kühlschrank einräumen. Die Roboter hatten laut Unternehmen zuvor nicht mit den spezifischen Objekten trainiert.

Training mit begrenzten Daten

Für das Training des Systems wurden nach Unternehmensangaben 500 Stunden Daten verwendet - deutlich weniger als bei vergleichbaren Projekten. Das System läuft auf eingebetteten GPUs in den Robotern, was einen kommerziellen Einsatz technisch möglich machen soll.

Figure-CEO Brett Adcock betont, dass dieser Durchbruch fundamental für die Skalierung von Robotern im Haushaltsbereich sei. Anders als bisherige Ansätze, die für jede neue Aufgabe neu programmiert werden müssen, könne Helix flexibel auf neue Situationen reagieren. Wie gut das in der Praxis funktioniert, muss sich zeigen.

Figure und OpenAI

Bis vor kurzem hat Figure AI mit OpenAI bei der Entwicklung roboterspezifischer KI-Modelle zusammengearbeitet. Anfang Februar beendeten die beiden Unternehmen ihre Zusammenarbeit. Das Unternehmen hinter ChatGPT ist aber auch ein wichtiger Investor.

Empfehlung

Figure-CEO Adcock begründet das Ende der Partnerschaft auf X damit, dass große Sprachmodelle (LLMs) zwar immer leistungsfähiger, aber auch immer mehr zur Massenware würden. Für Figure AI seien sie nur noch "der kleinste Teil des Puzzles".

Die weitaus größere Herausforderung bestehe darin, neue KI-Modelle für die Hochgeschwindigkeitssteuerung von Robotern in der realen Welt zu entwickeln. Diese Modelle würden von Figure AI vollständig selbst entwickelt.

Bereits im Januar war bekannt geworden, dass OpenAI nach der Schließung der Robotik-Abteilung vor einigen Jahren wieder eigene Hardware-Ingenieure für ein neues Robotik-Team sucht.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Figure hat das KI-System Helix vorgestellt, das humanoide Roboter in Echtzeit über Sprachbefehle steuern soll. Es besteht aus einem multimodalen Sprachmodell mit 7 Milliarden Parametern als "Gehirn" und einer zweiten KI mit 80 Millionen Parametern zur Übersetzung der Anweisungen in Roboterbewegungen.
  • Helix soll 35 Freiheitsgrade gleichzeitig kontrollieren können, von Fingerbewegungen bis zur Kopf- und Torsosteuerung. In Demonstrationen reagieren Roboter auf Sprachbefehle, identifizieren und greifen Objekte. Zwei Roboter arbeiten in einer Show-Küche zusammen, ohne zuvor mit den spezifischen Objekten trainiert zu haben.
  • Für das Training von Helix wurden 500 Stunden Daten verwendet. Das System läuft auf eingebetteten GPUs in den Robotern. Figure-CEO Brett Adcock sieht darin einen fundamentalen Durchbruch für die Skalierung von Robotern im Haushalt, da Helix flexibel auf neue Situationen reagieren könne. Die Praxistauglichkeit muss sich noch zeigen.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!