Inhalt
summary Zusammenfassung
Update
  • Custom Worlds ergänzt

Update vom 4. November 2024:

Anzeige

Decart AI hat ein Update für seinen KI-Game-Generator Oasis veröffentlicht: Mit "Custom Worlds" können Nutzer nun eigene Startbilder hochladen, die von der KI in eine neue, spielbare Welt verwandelt werden.

Video: Decart via X

Laut Decart AI ist dies Teil der Vision von Oasis, beliebige Bilder, auch aus der realen Welt, in spielbare Welten zu verwandeln. In der aktuellen Proof-of-Concept-Version verlieren die generierten Welten allerdings schnell die Ähnlichkeit mit dem Originalbild. Das soll in zukünftigen Versionen besser werden, verspricht das Unternehmen. Oasis befinde sich noch in einer frühen Entwicklungsphase und die "Custom Worlds" gäben einen ersten Einblick in die Möglichkeiten der Technologie.

Anzeige
Anzeige

Ursprünglicher Artikel vom 1. November 2024:

"Oasis" ist das erste sinnvoll spielbare in Echtzeit KI-generierte Game

Die KI-Startups Etched und Decart präsentieren mit "Oasis" ein Videospiel, das komplett von generativer KI generiert wird.

Spieler können sich in einer Minecraft-ähnlichen Spielewelt bewegen, springen, Gegenstände aufheben und Blöcke zerstören. Das System verarbeitet laut Decart Tastatureingaben der Nutzer und erzeugt daraus unmittelbar Gameplay, einschließlich Physik, Spielregeln und Grafik.

Video: Decart

Besonders beeindruckend ist die Geschwindigkeit: Während aktuelle Text-zu-Video-Modelle wie OpenAIs Sora oder Runway Gen-3 nach Angaben von Decart 10 bis 20 Sekunden für eine Sekunde Video benötigen, generiert Oasis laut Deckart "ohne Latenz" 20 Bilder pro Sekunde - also etwa alle 0,04 Sekunden ein neues Bild.

Empfehlung

Neue technische Basis ermöglicht Echtzeit-Generierung

Technisch nutzt Oasis laut Decart eine spezielle KI-Architektur auf Basis der Transformer-Technologie. Anders als vergleichbare Modelle kann es Bilder in Echtzeit generieren und dabei direkt auf Spielereingaben reagieren.

Flussdiagramm: Diffusion Transformer (DiT) Architektur mit Vision Transformer Encoder/Decoder und WASD-Nutzereingabe.
Die DIT-Architektur kombiniert Vision Transformer-Technologie mit einem Diffusionsmodell zur Bildverarbeitung. Durch die WASD-Steuerung und Maus können Nutzer direkt mit dem System interagieren und die Bildgenerierung beeinflussen. | Bild: Decart

Eine große Herausforderung war dabei, die Bildqualität über längere Zeit stabil zu halten. Das Unternehmen löste das Problem nach eigenen Angaben durch "dynamisches Rauschen", das während der Inferenz angepasst wird.

Zum Vergleich: Erst kürzlich hatte ein Team von Google Deepmind ein KI-System entwickelt, das Doom simulieren kann - allerdings mit starken Einschränkungen. Zusammenhängende Aktionen im Spiel sind dort nur in einem Zeitfenster von drei Sekunden möglich.

Auch das Oasis-System hat allerdings noch Schwachstellen: Laut Decart gibt es Probleme mit unscharfen Darstellungen in der Ferne, der zeitlichen Konsistenz unsicherer Objekte und der präzisen Kontrolle von Inventaren.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Größere Modelle und spezieller KI-Chip geplant

Decart vermutet, dass viele dieser Probleme durch größere Modelle und Datensätze gelöst werden können. Entwicklungspartner Etched arbeitet an einem speziellen KI-Chip namens Sohu, der auch größere Modelle mit bis zu 100 Milliarden Parametern in 4K-Auflösung verarbeiten können soll.

Derzeit läuft Oasis auf H100-GPUs in 360p-Auflösung. Die Kosten beschreibt Decart etwas kryptisch als "viel günstiger als das, was ein Nutzer für eine durchschnittliche Stunde eines Steam-Spiels bezahlt". Kryptisch deshalb, weil Steam-Spiele nicht nach Stunden bezahlt werden, sondern als Festpreis. Wahrscheinlich wird hier die durchschnittliche Steam-Spielzeit pro Spiel gegen den Umsatz gerechnet.

Das Venture-Capital-Unternehmen Sequoia Capital sieht in dem Projekt großes Potenzial und hat die Seed-Finanzierungsrunde über 21 Millionen US-Dollar des beteiligten KI-Labs Decart angeführt.

"Der heutige Start von Oasis, das nicht von einer Spiele-Engine, sondern von einem einzigen, auf Videos trainierten KI-Modell angetrieben wird, markiert einen Meilenstein in der Inferenz", schreibt Sequioa.

Decart und Eteched veröffentlichen den Code und die Gewichte eines 500-Millionen-Parameter-Modells, das lokal ausgeführt werden kann, bei Github. Zusätzlich gibt es eine spielbare Demo eines größeren Modells.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Das KI-Startup Decart präsentiert mit "Oasis" ein Videospiel, das komplett von generativer KI in Echtzeit generiert wird. Spieler können sich in einer Minecraft-ähnlichen Welt bewegen, Gegenstände aufheben und mit der Umgebung interagieren.
  • Technisch nutzt Oasis eine spezielle Transformer-Architektur, die Bilder mit 20 fps ohne Latenz erzeugt und direkt auf Eingaben reagiert. Herausforderungen wie stabile Bildqualität über längere Zeit wurden durch Techniken wie "dynamisches Rauschen" verbesssert.
  • Einschränkungen wie unscharfe Darstellungen und ungenaue Inventarkontrolle sollen künftig durch größere Modelle und spezialisierte KI-Hardware behoben werden können. Decart und Entwicklungspartner Etched stellen Code und Modelle als Open Source zur Verfügung.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!