Der Risikokapitalgeber a16z baut mit "AI Town" ein Forschungspapier nach und veröffentlicht den Code. Die Anwendung simuliert über ein Sprachmodell eine Sims-ähnliche virtuelle Welt, in der alle Charaktere flexibel ihren eigenen Motiven folgen und Entscheidungen treffen.
Im April veröffentlichte ein Forschungsteam von Google und Stanford die Forschungsarbeit zu "Smallville": OpenAIs GPT-3.5 simuliert KI-Agenten in einer digitalen Kleinstadt, die nur auf Befehle reagieren.
Jeder Charakter hat einen Beruf, eine Persönlichkeit und Beziehungen zu anderen Charakteren, die in einer Anfangsbeschreibung festgelegt werden. Durch weitere Befehle beginnen die KI-Agenten zu beobachten, zu planen und Entscheidungen zu treffen.
Das Experiment hat gezeigt, dass die vom Sprachmodell gesteuerten Figuren komplexe Verhaltensweisen und ein soziales Leben entwickeln, sich beispielsweise zu Partys verabreden. Das könnte zum Beispiel für die Entwicklung von Computerspielen oder für die Sozialforschung interessant sein.
AITown: Sprachmodell simuliert Sozialleben
Ein Team des Risikokapitalgebers a16z, der stark in generative KI investiert, hat nun Smallville als "AI Town" nachgebaut und als Open Source auf Github veröffentlicht. Auf Basis von AI Town kann man seine eigene kleine KI-Zivilisation aufbauen.
Das auf Javascript basierende "Starter Kit" unterstützt globale Zustände wie feste Orte, Aktivitäten, Gesundheit und so weiter sowie Transaktionen zwischen den Agenten, das heißt, ein virtueller Charakter kann einem anderen einen Apfel geben, woraufhin er selbst einen Apfel weniger hat. Das ist wichtig, um die Kohärenz der virtuellen Welt zu gewährleisten. Alle Ereignisse werden in einem eigenen Logbuch festgehalten.
Das Entwicklerteam hofft, dass andere Entwickler auf Basis des Starterkits die Plattform erweitern. Neben dem OpenAI-Sprachmodell verwendet die App Pinecone für die Vektordatenbank und Convex als Game-Engine und Datenbank. Die im Spiel verwendeten Pixelgrafiken wurden mit Replicate und Fal.ai generiert.
AI Town wird unter der MIT-Lizenz veröffentlicht. Anpassung, Verbreitung und kommerzielle Nutzung sind erlaubt. Den Code gibt es bei Github, die Demo hier und weiteren Austausch bei Discord.