Web World Models sollen KI-Agenten konsistente Spielwiesen geben
Kurz & Knapp
- Forscher der Princeton University, UCLA und University of Pennsylvania haben "Web World Models" entwickelt: Programmcode definiert die Regeln einer virtuellen Welt, ein Sprachmodell füllt sie mit Geschichten und Beschreibungen.
- Statt Datenbanken nutzt das System Hash-Funktionen – Inhalte werden bei Bedarf aus festen Parametern neu berechnet und bleiben so bei jedem Zugriff konsistent.
- Sieben Demo-Anwendungen zeigen das Konzept: von einem Reiseatlas über ein Sci-Fi-Universum bis zu einem Kartenspiel mit KI-generierten Spielkarten.
Forscher der Princeton University haben gemeinsam mit Kollegen der UCLA und University of Pennsylvania einen Ansatz vorgestellt, der KI-Agenten dauerhafte Welten zum Erkunden geben soll. Gewöhnlicher Web-Code legt dabei die Spielregeln fest, während ein Sprachmodell diese Welt mit Geschichten und Beschreibungen füllt.
Die Web World Models teilen die Welt in zwei Schichten. Die erste ist reiner Programmcode, geschrieben in TypeScript. Dieser Code legt fest, was es in der Welt gibt, wie Dinge zusammenhängen und welche Aktionen erlaubt sind. Er sorgt für logische Konsistenz – etwa, indem er verhindert, dass jemand durch verschlossene Türen geht oder mehr Geld ausgibt als vorhanden ist.

Die zweite Schicht übernimmt ein Sprachmodell. Es füllt das Gerüst mit Leben und generiert Umgebungsbeschreibungen, Dialoge mit Nicht-Spieler-Charakteren und ästhetische Details. Das Modell arbeitet dabei innerhalb der vorgegebenen Strukturen.
Entscheidend ist die Reihenfolge. Erst prüft der Code, ob eine Aktion überhaupt möglich ist. Dann erst darf die KI beschreiben, was passiert. Dadurch kann das Sprachmodell keine Regeln brechen, egal, wie kreativ es wird.
Ein "unendliches" Universum ohne Datenbank
Die vielleicht cleverste Idee betrifft die Speicherung. Wie bewahrt man ein fast unendliches Universum auf? Die Forscher verzichten ganz darauf und berechnen stattdessen jeden Ort bei Bedarf aus seinen Koordinaten neu.
Wenn ein Spieler einen bestimmten Planeten ansteuert, werden dessen Koordinaten durch eine Hash-Funktion geschickt. Diese Funktion liefert immer dasselbe Ergebnis für dieselben Koordinaten. Das Ergebnis fixiert dann die Zufallsparameter des Sprachmodells.

Ein Spieler kann also einen Planeten besuchen, ihn verlassen, später zurückkehren und findet exakt denselben Planeten vor. Nicht weil jemand ihn gespeichert hätte, sondern weil die Berechnung immer gleich abläuft. Die Forscher nennen das "Objektpermanenz ohne Speicherkosten".
Das System ist so gebaut, dass es auch ohne KI funktioniert. Wenn der Sprachmodell-Dienst langsam reagiert oder ganz ausfällt, springt das System auf vorgefertigte Vorlagen zurück. Die Welt verliert dann an semantischem Reichtum, aber die logische Kontinuität bleibt erhalten. Die eigentliche Logik steckt im Code, nicht in der KI. Das unterscheidet den Ansatz von rein generativen Systemen, bei denen ein Ausfall des Sprachmodells die gesamte Anwendung lahmlegt.
Vom Reiseatlas bis zum Kartenspiel
Um zu zeigen, dass das Konzept in verschiedenen Bereichen funktioniert, haben die Forscher sieben Anwendungen gebaut. Ein "Infinite Travel Atlas" verwandelt die echte Erde in einen erkundbaren Globus. Klickt man auf einen beliebigen Punkt, generiert das System Informationen zu Orten, Routen und Geschichten. Die geografischen Daten kommen aus dem Code, die Beschreibungen aus dem Sprachmodell.
Ein "Galaxy Travel Atlas" macht dasselbe für ein fiktives Sci-Fi-Universum. Der Code erzeugt Galaxien, Sternensysteme und Planeten nach festgelegten Regeln. Das Sprachmodell fügt Missionen, Charaktere und Bildungsinhalte hinzu. Wer einen Planeten besucht, bekommt ein Briefing über Terrain, Himmel, Signale und Gefahren.
Ein Kartenspiel namens "AI Spire" erlaubt Spielern, sich eigene Spielkarten zu wünschen. Wer etwa "einen Feuerball, der viel Brandschaden macht, aber den Gegner auch einfriert" eingibt, bekommt eine passende Karte generiert. Der Code prüft dabei über Schema-Validierung, dass die Karte den Spielregeln entspricht, und begrenzt Parameter wie Kosten und Kartentypen.


Weitere Demonstratoren umfassen eine Sandbox-Simulation namens "AI Alchemy", in der Elemente miteinander reagieren und die KI neue Reaktionsregeln vorschlägt, einen 3-D-Planetenerkunder ("Cosmic Voyager") mit laufender KI-Kommentierung sowie einen Generator für Wikipedia-ähnliche Artikel ("WWMPedia") und ein System für generative Langform-Literatur ("Bookshelf").
Ein Mittelweg mit offenen Fragen
Die Forscher positionieren ihre Arbeit als Mittelweg zwischen starren Datenbank-Anwendungen und unkontrollierbaren generativen Systemen. Web World Models sollen die Zuverlässigkeit klassischer Web-Entwicklung mit der Flexibilität von Sprachmodellen verbinden.
Für die Entwicklung von KI-Agenten könnte das relevant werden. Agenten, die eigenständig Aufgaben erledigen sollen, benötigen Trainingsumgebungen. Diese müssen konsistent sein, damit der Agent sinnvolle Erfahrungen sammelt, aber auch flexibel genug für unvorhergesehene Situationen.
Offen bleibt, wie gut der Ansatz bei komplexeren Interaktionen skaliert. Die gezeigten Anwendungen sind beeindruckend, aber relativ klar strukturiert. Ob Web-World-Models auch für Szenarien taugen, in denen viele Agenten gleichzeitig handeln oder die Regeln selbst sich ändern müssen, zeigen die Forscher nicht.
Die Forschung an Trainingsumgebungen für KI-Agenten gewinnt aktuell an Dynamik. Eine aktuelle Studie von Microsoft Research und US-Unis zeigt, dass feinabgestimmte LLMs diese Rolle übernehmen können und Umgebungszustände mit über 99 Prozent Genauigkeit vorhersagen. Turing-Preisträger Richard Sutton sieht solche Weltmodelle als Schlüssel für das erfahrungsbasierte Lernen künftiger KI-Agenten.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnieren