Die KI-Startups Etched und Decart präsentieren mit "Oasis" ein Videospiel, das komplett von generativer KI generiert wird.
Spieler können sich in einer Minecraft-ähnlichen Spielewelt bewegen, springen, Gegenstände aufheben und Blöcke zerstören. Das System verarbeitet laut Decart Tastatureingaben der Nutzer und erzeugt daraus unmittelbar Gameplay, einschließlich Physik, Spielregeln und Grafik.
Besonders beeindruckend ist die Geschwindigkeit: Während aktuelle Text-zu-Video-Modelle wie OpenAIs Sora oder Runway Gen-3 nach Angaben von Decart 10 bis 20 Sekunden für eine Sekunde Video benötigen, generiert Oasis laut Deckart "ohne Latenz" 20 Bilder pro Sekunde - also etwa alle 0,04 Sekunden ein neues Bild.
Neue technische Basis ermöglicht Echtzeit-Generierung
Technisch nutzt Oasis laut Decart eine spezielle KI-Architektur auf Basis der Transformer-Technologie. Anders als vergleichbare Modelle kann es Bilder in Echtzeit generieren und dabei direkt auf Spielereingaben reagieren.
Eine große Herausforderung war dabei, die Bildqualität über längere Zeit stabil zu halten. Das Unternehmen löste das Problem nach eigenen Angaben durch "dynamisches Rauschen", das während der Inferenz angepasst wird.
Zum Vergleich: Erst kürzlich hatte ein Team von Google Deepmind ein KI-System entwickelt, das Doom simulieren kann - allerdings mit starken Einschränkungen. Zusammenhängende Aktionen im Spiel sind dort nur in einem Zeitfenster von drei Sekunden möglich.
Auch das Oasis-System hat allerdings noch Schwachstellen: Laut Decart gibt es Probleme mit unscharfen Darstellungen in der Ferne, der zeitlichen Konsistenz unsicherer Objekte und der präzisen Kontrolle von Inventaren.
Größere Modelle und spezieller KI-Chip geplant
Decart vermutet, dass viele dieser Probleme durch größere Modelle und Datensätze gelöst werden können. Entwicklungspartner Etched arbeitet an einem speziellen KI-Chip namens Sohu, der auch größere Modelle mit bis zu 100 Milliarden Parametern in 4K-Auflösung verarbeiten können soll.
Derzeit läuft Oasis auf H100-GPUs in 360p-Auflösung. Die Kosten beschreibt Decart etwas kryptisch als "viel günstiger als das, was ein Nutzer für eine durchschnittliche Stunde eines Steam-Spiels bezahlt". Kryptisch deshalb, weil Steam-Spiele nicht nach Stunden bezahlt werden, sondern als Festpreis. Wahrscheinlich wird hier die durchschnittliche Steam-Spielzeit pro Spiel gegen den Umsatz gerechnet.
Das Venture-Capital-Unternehmen Sequoia Capital sieht in dem Projekt großes Potenzial und hat die Seed-Finanzierungsrunde des beteiligten KI-Labs Decart angeführt.
"Der heutige Start von Oasis, das nicht von einer Spiele-Engine, sondern von einem einzigen, auf Videos trainierten KI-Modell angetrieben wird, markiert einen Meilenstein in der Inferenz", schreibt Sequioa.
Decart und Eteched veröffentlichen den Code und die Gewichte eines 500-Millionen-Parameter-Modells, das lokal ausgeführt werden kann, bei Github. Zusätzlich gibt es eine spielbare Demo eines größeren Modells.