Skip to content

GPT-3-Demo in Roblox zeigt die KI-Zukunft von NPCs

Image description
Dr. Alan D. Thompson | YouTube | Roblox

Googles SayCan steuert Roboter per großem Sprachmodell. IBM-Entwickler James Weaver überträgt diesen Ansatz nun auf Nicht-Spieler-Charaktere in der Gaming-Sandbox Roblox.

Große Sprachmodelle wie OpenAIs GPT-3 oder Googles PaLM können Texte übersetzen, vervollständigen, Dialoge führen oder Code generieren. Während längst nicht alle emergenten Fähigkeiten der Modelle erkundet sind, kombinieren KI-Forschende diese bereits mit externen Modulen für Python-Zugriff, mit Physik-Simulatoren und setzen sie in CICERO für Diplomacy-Spiele oder für innere Monologe in Robotern ein.

Google KI-Abteilung kombinierte im Sommer 2022 aktuelle Robotertechnologie mit PaLM. In PaLM-SayCan verwandelt ein Sprachmodell Text-Eingaben von Nutzenden in Roboter-Anweisungen, erlaubt Nachfragen und fördert so flexibleres Roboter-Verhalten.

Googles SayCan nutzt Sprachmodell für mehr Roboter-Flexibilität

Googles SayCan nutzt Chain-of-Thought-Prompting, um mögliche Schritte für die Erfüllung einer Anweisung zu generieren und bewertet anschließend deren Erfolgswahrscheinlichkeiten. Die Handlungskette, der vom Sprachmodell die höchste Erfolgswahrscheinlichkeit zugerechnet wird, führt der Roboter aus.

Der Vorteil dabei ist, dass der Roboter Anweisungen in natürlicher Sprache annimmt. Wer nach einem energiereichen Snack verlangt, erhält vom Roboter bevorzugt einen Energieriegel. Ist der nicht verfügbar, erkennt der Roboter einen Apfel oder ein Zucker-Getränk als zielgerecht.

Roblox-Demo ist Googles SayCan für NPCs

IBM-Entwickler James Weaver zeigt nun in einer Roblox-Demo, wie die Ideen aus SayCan für flexiblere NPCs genutzt werden können. Für seine Implementation greift Weaver auf GPT-3 zu. Wer die Demo testen will, muss also einen OpenAI API-Schlüssel bereithalten.

In der Sandbox können Spieler:innen dann einem NPCs Anweisungen per Chat-Fenster geben, etwa "gebe die Reischips in die Schüssel und stelle dann den Tee auf den Tisch".

Alle interaktiven Objekte sind eindeutig benannt und per natürlicher Sprache durch den NPC identifizierbar. | Bild: Dr. Alan D. Thompson, YouTube, Roblox

Alle Objekte in der Demo sind simple Boxen oder Tische, die entsprechend ihrer Rolle benannt sind. Der NPC orientiert sich an den Objektnamen und führt die Befehle durch. Dafür verwandelt GPT-3 im Hintergrund die natürlichsprachlichen Befehle in Roboter-Instruktionen um, etwa in

find(rice chips), pick(rice chips), find(bowl), put(rice chips), find(tea), pick(tea), find(table), put(tea), done() .

Die Demo gibt es auf der Roblox-Website, weiterführende Informationen auf Weavers GitHub.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: Roblox

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren