Skip to content

Figure AI zeigt Roboter, der endlich den Kühlschrank einräumen kann

Image description
Figure AI

Kurz & Knapp

  • Figure hat das KI-System Helix vorgestellt, das humanoide Roboter in Echtzeit über Sprachbefehle steuern soll. Es besteht aus einem multimodalen Sprachmodell mit 7 Milliarden Parametern als "Gehirn" und einer zweiten KI mit 80 Millionen Parametern zur Übersetzung der Anweisungen in Roboterbewegungen.
  • Helix soll 35 Freiheitsgrade gleichzeitig kontrollieren können, von Fingerbewegungen bis zur Kopf- und Torsosteuerung. In Demonstrationen reagieren Roboter auf Sprachbefehle, identifizieren und greifen Objekte. Zwei Roboter arbeiten in einer Show-Küche zusammen, ohne zuvor mit den spezifischen Objekten trainiert zu haben.
  • Für das Training von Helix wurden 500 Stunden Daten verwendet. Das System läuft auf eingebetteten GPUs in den Robotern. Figure-CEO Brett Adcock sieht darin einen fundamentalen Durchbruch für die Skalierung von Robotern im Haushalt, da Helix flexibel auf neue Situationen reagieren könne. Die Praxistauglichkeit muss sich noch zeigen.

Das Startup Figure hat mit Helix ein KI-System vorgestellt, das humanoiden Robotern ermöglicht, komplexe Bewegungen durch Sprachbefehle auszuführen. Das System soll ohne spezifisches Training neue Objekte handhaben können.

Das Startup Figure hat ein neues KI-System namens Helix entwickelt. Laut dem Unternehmen handelt es sich um ein Vision-Language-Action (VLA) Modell, das den Oberkörper eines humanoiden Roboters in Echtzeit steuern soll.

Das System basiert auf zwei Komponenten: Ein multimodales Sprachmodell mit 7 Milliarden Parametern verarbeitet Sprache und visuelle Informationen mit 7-9 Hz und dient als "Gehirn". Eine zweite KI mit 80 Millionen Parametern übersetzt die vom Sprachmodell weitergegebenen Anweisungen in Roboterbewegungen mit 200 Hz.

Bild: Figure AI

Steuerung von 35 Bewegungsachsen

Das System soll 35 Freiheitsgrade gleichzeitig kontrollieren können - von Fingerbewegungen bis zur Kopf- und Torsosteuerung. In Demonstrationsvideos zeigt Figure, wie Roboter auf Sprachbefehle reagieren und entsprechende Objekte identifizieren und greifen.

In einem weiteren Test lässt Figure zwei Roboter zusammenarbeiten, die gemeinsam Lebensmittel in einer Show-Küche etwa in einen Kühlschrank einräumen. Die Roboter hatten laut Unternehmen zuvor nicht mit den spezifischen Objekten trainiert.

Training mit begrenzten Daten

Für das Training des Systems wurden nach Unternehmensangaben 500 Stunden Daten verwendet - deutlich weniger als bei vergleichbaren Projekten. Das System läuft auf eingebetteten GPUs in den Robotern, was einen kommerziellen Einsatz technisch möglich machen soll.

Figure-CEO Brett Adcock betont, dass dieser Durchbruch fundamental für die Skalierung von Robotern im Haushaltsbereich sei. Anders als bisherige Ansätze, die für jede neue Aufgabe neu programmiert werden müssen, könne Helix flexibel auf neue Situationen reagieren. Wie gut das in der Praxis funktioniert, muss sich zeigen.

Figure und OpenAI

Bis vor kurzem hat Figure AI mit OpenAI bei der Entwicklung roboterspezifischer KI-Modelle zusammengearbeitet. Anfang Februar beendeten die beiden Unternehmen ihre Zusammenarbeit. Das Unternehmen hinter ChatGPT ist aber auch ein wichtiger Investor.

Figure-CEO Adcock begründet das Ende der Partnerschaft auf X damit, dass große Sprachmodelle (LLMs) zwar immer leistungsfähiger, aber auch immer mehr zur Massenware würden. Für Figure AI seien sie nur noch "der kleinste Teil des Puzzles".

Die weitaus größere Herausforderung bestehe darin, neue KI-Modelle für die Hochgeschwindigkeitssteuerung von Robotern in der realen Welt zu entwickeln. Diese Modelle würden von Figure AI vollständig selbst entwickelt.

Bereits im Januar war bekannt geworden, dass OpenAI nach der Schließung der Robotik-Abteilung vor einigen Jahren wieder eigene Hardware-Ingenieure für ein neues Robotik-Team sucht.

Quelle: Figure

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren