Der Chef-Entwickler von Modbox unterhält sich in VR mit virtuellen Figuren, die ihre Antworten mit GPT-3 generieren.
Die Kreativ-VR-App Modbox erschien bereits im April 2016. Modbox gibt Nutzern allerhand Werkzeuge an die Hand, mit denen sie eigene Welten, Spiele oder andere Erfahrungen in VR und am Desktop erschaffen und mit anderen Spielern erkunden können.
Seit der Veröffentlichung hat das Entwicklerstudio Alientrap um Gründer Lee Vermeulen Modbox mit zahlreichen Updates verbessert. Im September 2020 erschien Version 2.0 mit einem umfangreichen Interface- und Featureupgrade.
In einigen Wochen soll ein weiteres Update erscheinen. Diesmal im Fokus: KI-Verbesserungen für virtuelle Passanten und andere künstliche Geschöpfe. In einem Video gibt Vermeulen einen kurzen Einblick und zeigt nebenher, wie der Nicht-Spieler-Charakter (NPC) der Zukunft seine Sprache generiert.
KI-Stimmen für alle
Über ein einfaches Interface stattet Vermeulen die virtuellen Menschen in der Testumgebung mit Text-zu-Sprache-Fähigkeiten aus. Aktuell unterstützt Modbox Amazons Polly und Replica. Beide Systeme können Text in synthetische Sprache verwandeln mit verschiedenen Stimmen.
Nutzer könnten so etwa Dialoge automatisch vertonen lassen. Solche KI-Stimmen kommen auch gerade in Skyrims Modding-Szene zum Einsatz.
Dann wendet sich Vermeulen Bobby zu, einem weiteren NPC, der über die Straßen seiner Testumgebung wandert. Auch der generiert seine Worte mit der Replica-KI. Doch Bobby kann noch mehr: Er ist direkt mit OpenAIs mächtiger Text-KI GPT-3 verknüpft.
Bobbys langer Weg zum Rathaus
Vermeulen zieht die VR-Brille Quest 2 (Test) auf und spricht Bobby an: „Wohin gehst du?“ Eine Spracherkennungs-KI greift Vermeulens Aussage auf und leitet sie als Text über OpenAIs API an GPT-3. Ein paar Sekunden vergehen, dann erfahren wir, dass Bobby zur Arbeit muss und keine Zeit hat.
Doch Vermeulen lässt nicht locker: „Wo arbeitest du?“ Erneut vergehen einige Sekunden, in denen GPT-3 seine Antwort generiert. „Ich arbeite im Rathaus. Es ist das Regierungsgebäude in der Mitte der Stadt. Ein großes und wunderschönes Gebäude, du kannst es nicht verfehlen.“
Auf die Frage, wo das Rathaus liegt, antwortet Bobby: „Du bist smart, das mag ich an dir. Das Rathaus liegt am Rathaus-Straßen Standort.“ An diesem Punkt beendet Vermeulen das Gespräch und wendet sich dem Hot-Dog-Verkäufer zu.
Die Zukunft des NPCs
Der letzte Satz lässt den ein oder anderen wohl an Bobbys geistiger Gesundheit zweifeln. Und dann sind da noch diese langen Pausen.
Doch es ist nicht das Gespräch an sich, dass beeindruckend ist – es ist die Tatsache, dass es dank GPT-3 bei jedem Versuch anders ablaufen wird. Das ermöglicht dynamische Gespräche und einzigartige Erfahrungen, wie wir sie etwa in unserem MIXEDCAST Folge #229 AI-Dungeon-Abenteuer selbst erleben durften.
AI Dungeon ist auch ein gutes Beispiel für den Versuch, die erzählerische Unberechenbarkeit von GPT-3 in einigermaßen geordnete Bahnen zu lenken. Das ist eine Grundvoraussetzung, bevor Sprach-KIs wie GPT-3 im Videospiel-Mainstream ankommen. Nur so ist es möglich, dass die Gespräche mit NPCs die Spielwelt und –handlung unterstützen.
Modbox muss erst einmal ohne GPT-3 auskommen
Können sich alle Modbox-Nutzer jetzt bald mit GPT-3 unterhalten? Vermeulen gibt darauf keine klare Antwort. Alle gezeigten Features wie Replica seien Teil des nächsten Updates, versichert er in den Kommentaren unter seinem Video. Er sei sich aber nicht sicher, ob er die GPT-3-Implementierung schon veröffentlichen könne.
Das hat wohl auch damit zu tun, dass GPT-3 Geld kostet. Nach einer kostenlosen, geschlossenen Beta-Phase führte OpenAI ein Bezahlmodell für die Sprach-KI ein. Der Preis richtet sich nach der Anzahl Anfragen.
Sollte Modbox also GPT-3-Unterstützung erhalten, wird diese wohl entweder einen eigenen kostenpflichtigen API-Zugang beim Nutzer voraussetzen oder Alientrap muss sich die Nutzung bezahlen lassen.
Die einzige kostenlose Alternative wäre eine Variante mit stark begrenzter Wortzahl. Das kostenlose Explore-Paket von OpenAI umfasst 100.000 Wörter im Monat. Dieses Volumen müssten sich alle Modbox-Spieler teilen – das wäre wohl zu wenig.
Ein weiterer Stopper dürften die in GPT-3 versteckten mannigfaltigen Vorurteile sein, die Gamer über kurz oder lang entdecken und öffentlich machen könnten. Für Vermeulen bedeutet das ein hohes unternehmerisches Risiko, da die drohende Kritik im Kern zwar nur GPT-3 beträfe, aber sein Spiel Modbox ebenso ins Kreuzfeuer geraten würde. Dieses Risiko besteht ebenso für alle anderen Spieleentwickler, die über eine Integration von GPT-3 nachdenken.
Titelbild: Lee Vermeulen