Forscher haben ein KI-Modell entwickelt, das CS:GO innerhalb eines neuronalen Netzwerks simulieren kann. Die Leistung ist mit 10 FPS und eingeschränkter Stabilität noch begrenzt, zeigt aber das Potenzial für komplexe Spielsimulationen.
Ein Forschungsteam hat ein KI-Modell namens "DIAMOND" (Diffusion for World Modeling) entwickelt, das in der Lage ist, das beliebte Computerspiel Counter-Strike: Global Offensive (CS:GO) innerhalb eines neuronalen Netzwerks zu simulieren. Laut Eloi Alonso, einem der beteiligten Forscher, läuft die Simulation auf einer einzelnen Nvidia RTX 3090 Grafikkarte mit einer Bildrate von 10 Bildern pro Sekunde (FPS).
There are still many limitations of our model. We’re sure you can find more yourself by interacting with the model.
However, we expect the world model would continue to improve by scaling up data and compute, given our dataset only amounts to 87h of gameplay.
(4/n) pic.twitter.com/EnqWiveUFL
— Eloi Alonso (@EloiAlonso1) October 11, 2024
Das Modell wurde mit 87 Stunden CS:GO-Gameplay-Daten trainiert, was nach Angaben der Forscher lediglich 0,5 % der Datenmenge entspricht, die für vergleichbare Projekte wie GameNGen verwendet wurde. Trotz dieser begrenzten Datenmenge kann das Modell eine verhältnismäßig beeindruckende Simulation des Spiels erzeugen.
Die Forscher nutzten einen Transformer-basierten Ansatz, der Spielerbewegungen als "Token" behandelt, ähnlich wie Wörter in einem Satz. Durch autoregressive Vorhersage dieser Token lernt das Modell, die nächste Bewegung auf Grundlage der vorherigen Bewegungssequenz vorherzusagen.
Alonso demonstrierte die Fähigkeiten des Modells in einem Twitter-Thread, in dem er Videos von Spielern zeigte, die mit Tastatur und Maus in der simulierten CS:GO-Umgebung interagieren. Die Simulation umfasst komplexe Aspekte wie Spielerinteraktionen, Waffenmechaniken und Umgebungsphysik.
Limitierungen und Glitches zeigen Herausforderungen der KI-Simulation
Trotz der beeindruckenden Leistung weist das Modell noch einige Limitierungen und Glitches auf. So können Spieler in der Simulation unendlich oft springen, da das Modell das Drücken der Sprungtaste als feste Reaktion interpretiert, ohne die Schwerkraft oder Kollisionserkennung der Source Engine zu berücksichtigen.
Die Forscher betonen, dass sie erwarten, dass sich das Weltmodell durch die Skalierung von Daten und Rechenleistung weiter verbessern wird. Sie sehen in ihrem Ansatz das Potenzial, KI-Modelle zu entwickeln, die sich flexibel in komplexen realen Umgebungen bewegen können.
Inspiriert wurde das Upgrade laut Alonso von GameNGen, einem KI-System, das von Forschern von Google Research, Google Deepmind und der Tel Aviv University entwickelt wurde. GameNGen ist in der Lage, Passagen des klassischen Computerspiels DOOM vollständig zu simulieren und in Echtzeit mit über 20 Bildern pro Sekunde auf einem einzelnen TPU-Chip von Google wiederzugeben.
Das DIAMOND-Modell wurde ursprünglich für Atari-Spiele im Mai vorgestellt und nun für die Simulation von CS:GO erweitert. Mehr Details und das Modell sind auf GitHub verfügbar. Interessierte können dort auf die Demos herunterladen.