Inhalt
summary Zusammenfassung

Googles SayCan steuert Roboter per großem Sprachmodell. IBM-Entwickler James Weaver überträgt diesen Ansatz nun auf Nicht-Spieler-Charaktere in der Gaming-Sandbox Roblox.

Große Sprachmodelle wie OpenAIs GPT-3 oder Googles PaLM können Texte übersetzen, vervollständigen, Dialoge führen oder Code generieren. Während längst nicht alle emergenten Fähigkeiten der Modelle erkundet sind, kombinieren KI-Forschende diese bereits mit externen Modulen für Python-Zugriff, mit Physik-Simulatoren und setzen sie in CICERO für Diplomacy-Spiele oder für innere Monologe in Robotern ein.

Google KI-Abteilung kombinierte im Sommer 2022 aktuelle Robotertechnologie mit PaLM. In PaLM-SayCan verwandelt ein Sprachmodell Text-Eingaben von Nutzenden in Roboter-Anweisungen, erlaubt Nachfragen und fördert so flexibleres Roboter-Verhalten.

Googles SayCan nutzt Sprachmodell für mehr Roboter-Flexibilität

Googles SayCan nutzt Chain-of-Thought-Prompting, um mögliche Schritte für die Erfüllung einer Anweisung zu generieren und bewertet anschließend deren Erfolgswahrscheinlichkeiten. Die Handlungskette, der vom Sprachmodell die höchste Erfolgswahrscheinlichkeit zugerechnet wird, führt der Roboter aus.

Anzeige
Anzeige

Der Vorteil dabei ist, dass der Roboter Anweisungen in natürlicher Sprache annimmt. Wer nach einem energiereichen Snack verlangt, erhält vom Roboter bevorzugt einen Energieriegel. Ist der nicht verfügbar, erkennt der Roboter einen Apfel oder ein Zucker-Getränk als zielgerecht.

Roblox-Demo ist Googles SayCan für NPCs

IBM-Entwickler James Weaver zeigt nun in einer Roblox-Demo, wie die Ideen aus SayCan für flexiblere NPCs genutzt werden können. Für seine Implementation greift Weaver auf GPT-3 zu. Wer die Demo testen will, muss also einen OpenAI API-Schlüssel bereithalten.

In der Sandbox können Spieler:innen dann einem NPCs Anweisungen per Chat-Fenster geben, etwa "gebe die Reischips in die Schüssel und stelle dann den Tee auf den Tisch".

Alle interaktiven Objekte sind eindeutig benannt und per natürlicher Sprache durch den NPC identifizierbar. | Bild: Dr. Alan D. Thompson, YouTube, Roblox

Alle Objekte in der Demo sind simple Boxen oder Tische, die entsprechend ihrer Rolle benannt sind. Der NPC orientiert sich an den Objektnamen und führt die Befehle durch. Dafür verwandelt GPT-3 im Hintergrund die natürlichsprachlichen Befehle in Roboter-Instruktionen um, etwa in

find(rice chips), pick(rice chips), find(bowl), put(rice chips), find(tea), pick(tea), find(table), put(tea), done() .

Die Demo gibt es auf der Roblox-Website, weiterführende Informationen auf Weavers GitHub.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Googles SayCan steuert Roboter durch ein großes Sprachmodell. Das macht sie flexibler im Umgang mit der Umgebung und mit Menschen.
  • Eine neue Roblox-Demo zeigt, wie dieser Ansatz auch zu flexibleren Nicht-Spieler-Charaktern in Games beitragen kann.
  • Der IBM-Entwickler James Weaver implementiert dafür die Ideen aus SayCan in Roblox: Spielende können über ein Text-Fenster einen NPC objektbezogene Aufgaben ausführen lassen.
  • Im Hintergrund verwandelt GPT-3 die natürlichsprachlichen Anfragen in Roboteranweisungen.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!