Das Startup Figure hat mit Helix ein KI-System vorgestellt, das humanoiden Robotern ermöglicht, komplexe Bewegungen durch Sprachbefehle auszuführen. Das System soll ohne spezifisches Training neue Objekte handhaben können.
Das Startup Figure hat ein neues KI-System namens Helix entwickelt. Laut dem Unternehmen handelt es sich um ein Vision-Language-Action (VLA) Modell, das den Oberkörper eines humanoiden Roboters in Echtzeit steuern soll.
Das System basiert auf zwei Komponenten: Ein multimodales Sprachmodell mit 7 Milliarden Parametern verarbeitet Sprache und visuelle Informationen mit 7-9 Hz und dient als "Gehirn". Eine zweite KI mit 80 Millionen Parametern übersetzt die vom Sprachmodell weitergegebenen Anweisungen in Roboterbewegungen mit 200 Hz.
Steuerung von 35 Bewegungsachsen
Das System soll 35 Freiheitsgrade gleichzeitig kontrollieren können - von Fingerbewegungen bis zur Kopf- und Torsosteuerung. In Demonstrationsvideos zeigt Figure, wie Roboter auf Sprachbefehle reagieren und entsprechende Objekte identifizieren und greifen.
In einem weiteren Test lässt Figure zwei Roboter zusammenarbeiten, die gemeinsam Lebensmittel in einer Show-Küche etwa in einen Kühlschrank einräumen. Die Roboter hatten laut Unternehmen zuvor nicht mit den spezifischen Objekten trainiert.
Introducing Helix, our newest AI that thinks like a human
To bring robots into homes, we need a step change in capabilities
Helix can generalize to any household item 🧵pic.twitter.com/sPzPV4B50J
— Brett Adcock (@adcock_brett) February 20, 2025
Training mit begrenzten Daten
Für das Training des Systems wurden nach Unternehmensangaben 500 Stunden Daten verwendet - deutlich weniger als bei vergleichbaren Projekten. Das System läuft auf eingebetteten GPUs in den Robotern, was einen kommerziellen Einsatz technisch möglich machen soll.
Figure-CEO Brett Adcock betont, dass dieser Durchbruch fundamental für die Skalierung von Robotern im Haushaltsbereich sei. Anders als bisherige Ansätze, die für jede neue Aufgabe neu programmiert werden müssen, könne Helix flexibel auf neue Situationen reagieren. Wie gut das in der Praxis funktioniert, muss sich zeigen.
Figure und OpenAI
Bis vor kurzem hat Figure AI mit OpenAI bei der Entwicklung roboterspezifischer KI-Modelle zusammengearbeitet. Anfang Februar beendeten die beiden Unternehmen ihre Zusammenarbeit. Das Unternehmen hinter ChatGPT ist aber auch ein wichtiger Investor.
Figure-CEO Adcock begründet das Ende der Partnerschaft auf X damit, dass große Sprachmodelle (LLMs) zwar immer leistungsfähiger, aber auch immer mehr zur Massenware würden. Für Figure AI seien sie nur noch "der kleinste Teil des Puzzles".
Die weitaus größere Herausforderung bestehe darin, neue KI-Modelle für die Hochgeschwindigkeitssteuerung von Robotern in der realen Welt zu entwickeln. Diese Modelle würden von Figure AI vollständig selbst entwickelt.
Bereits im Januar war bekannt geworden, dass OpenAI nach der Schließung der Robotik-Abteilung vor einigen Jahren wieder eigene Hardware-Ingenieure für ein neues Robotik-Team sucht.