Inhalt
summary Zusammenfassung

Forschende haben ein KI-System entwickelt, das das klassische Computerspiel DOOM simulieren und in Echtzeit wiedergeben kann. GameNGen eröffnet neue Möglichkeiten für die KI-gestützte Spieleentwicklung.

Anzeige

Ein Forschungsteam von Google Research, Google Deepmind und der Tel Aviv University hat mit GameNGen erstmals ein KI-System geschaffen, das ein komplexes Computerspiel vollständig simulieren und in Echtzeit wiedergeben kann. Das System ist in der Lage, das ikonische Spiel DOOM mit mehr als 20 Bildern pro Sekunde auf einem einzelnen von Googles TPU-Chip zu simulieren.

Die Bildqualität der Simulation erreicht dabei einen PSNR-Wert (Peak Signal-to-Noise Ratio) von 29,4, was laut dem Team mit verlustbehafteter JPEG-Kompression vergleichbar ist. In Tests konnten menschliche Bewerter kurze Ausschnitte der Simulation nur geringfügig besser als der Zufall von echten Spielszenen unterscheiden.

GameNGen wurde in zwei Phasen trainiert: Zunächst lernte ein KI-Agent, das Spiel zu spielen, wobei die Trainingssitzungen aufgezeichnet wurden. Anschließend wurde ein Diffusionsmodell darauf trainiert, das nächste Bild basierend auf der Sequenz vorheriger Bilder und Aktionen zu erzeugen.

Anzeige
Anzeige
Bild: Valevski et al.

Das resultierende System ist in der Lage, komplexe "Spielzustandsaktualisierungen" durchzuführen, also das Zählen von Gesundheit und Munition, das Aufheben von Waffen, das Angreifen von Gegnern, das Beschädigen von Objekten und das Öffnen von Türen. Zudem kann es den Spielzustand über längere Zeit aufrechterhalten, das Team zeigt Clips von etwa 2,5 Minuten.

Video: Valevski et al.

Es gibt jedoch Einschränkungen: So ist das "Gedächtnis" des Systems auf ca. 3 Sekunden begrenzt. Das bedeutet, dass Ereignisse, die länger als 3 Sekunden zurückliegen, vom System nicht mehr berücksichtigt werden können. Dies schränkt die Fähigkeit des Systems ein, langfristige Zusammenhänge im Spiel zu erfassen und darauf zu reagieren. Es ist daher überraschend, dass das Modell überhaupt ein so konsistentes Spielerlebnis ermöglicht.

GameNGen zeigt ein neues Paradigma für Spiele-Engines

GameNGen baut auf früheren Arbeiten zur Simulation interaktiver Videospiele mit neuronalen Modellen auf. Im Vergleich zu bisherigen Ansätzen wie GameGAN oder GAN Theft Auto erzielt es deutliche Verbesserungen hinsichtlich der Komplexität der simulierten Spiele, der Simulationsgeschwindigkeit, der Stabilität über längere Zeiträume und der visuellen Qualität.

Bild: Valevski et al.

Die Entwickler sehen in GameNGen einen wichtigen Schritt hin zu einem neuen Paradigma für Spiele-Engines, bei dem Spiele automatisch durch neuronale Modelle generiert werden könnten. Allerdings bleiben noch offene Fragen, etwa wie solche neuronalen Spiele-Engines trainiert und wie Spiele effektiv erstellt werden könnten, einschließlich der optimalen Nutzung menschlicher Eingaben.

Empfehlung

Mehr Beispiele und den Code gibt es auf GitHub.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Forschende von Google Research, Google Deepmind und der Tel Aviv University haben GameNGen entwickelt, ein KI-System, das das Computerspiel DOOM simulieren und in Echtzeit wiedergeben kann. Es erreicht über 20 Bilder pro Sekunde auf einem einzelnen TPU-Chip von Google.
  • Das System wurde in zwei Phasen trainiert: Zuerst lernte ein KI-Agent das Spiel zu spielen, dann wurde ein Diffusionsmodell darauf trainiert, das nächste Bild basierend auf vorherigen Bildern und Aktionen zu erzeugen. Es kann komplexe Spielzustandsaktualisierungen durchführen und den Spielzustand über längere Zeit aufrechterhalten.
  • GameNGen zeigt Verbesserungen gegenüber früheren Ansätzen in Bezug auf Komplexität, Geschwindigkeit, Stabilität und visuelle Qualität. Die Entwickler sehen darin einen Schritt zu einem neuen Paradigma für Spiele-Engines, bei dem Spiele automatisch durch neuronale Modelle generiert werden könnten.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!