Figuren in Videospielen könnten sich bald noch realistischer anfühlen. Doch auch abseits vom Gaming könnten diese KI-Sims hilfreich sein.
In einer neuen Arbeit simulieren Forschende von Google und der Stanford University menschliches Verhalten mit großen Sprachmodellen. Die Publikation mit dem Titel „Generative Agents: Interactive Simulacra of Human Behavior“ setzt auf ChatGPT und bietet nicht nur einen spannenden Einblick in die Zukunft von Videospielen.
25 KI-Sims leben in ihrer eigenen Welt
Inspiriert von der Spielereihe "Die Sims" haben die Wissenschaftler:innen eine Sandbox-Umgebung eingerichtet, in der 25 KI-Agenten völlig autonom ihrem Tagewerk nachgehen.
Jede Figur haben sie mit einer kurzen, rund 1.000 Zeichen langen Beschreibung ihres Berufs, ihrer Persönlichkeit und vor allem ihrer Beziehungen zu den anderen Bewohner:innen von „Smallville“ versehen. Bei KI-Agent John Lin sieht das zum Beispiel so aus:
John Lin ist Apothekenverkäufer im Willow Market and Pharmacy und liebt es, Menschen zu helfen. Er ist immer auf der Suche nach Möglichkeiten, seinen Kunden die Medikamentenbeschaffung zu erleichtern; John Lin lebt mit seiner Frau Mei Lin, die Hochschulprofessorin ist, und seinem Sohn Eddy Lin, der Musiktheorie studiert, zusammen; John Lin liebt seine Familie sehr; John Lin kennt das alte Ehepaar von nebenan, Sam Moore und Jennifer Moore, schon seit einigen Jahren; John Lin hält Sam Moore für einen freundlichen und netten Mann; John Lin kennt seine Nachbarin Yuriko Yamamoto gut; John Lin kennt seine Nachbarn Tamara Taylor und Carmen Ortiz, ist ihnen aber noch nie begegnet; John Lin und Tom Moreno sind Kollegen im "The Willows Market and Pharmacy"; John Lin und Tom Moreno sind befreundet und diskutieren gerne gemeinsam über Kommunalpolitik; John Lin kennt die Familie Moreno einigermaßen gut - den Ehemann Tom Moreno und die Ehefrau Jane Moreno.
"Glaubwürdiges soziales Verhalten"
Die Sim-Figuren zeigen "glaubwürdiges individuelles und emergentes soziales Verhalten", sobald sie in die virtuelle Welt entlassen werden, so das Team. Ein Beispiel dafür ist eine Valentinstagsparty, die von einer einzelnen Bewohnerin initiiert wird.
Innerhalb von zwei virtuellen Tagen laden sich die Sims selbstständig zu genau dieser Party ein, verabreden sich und erscheinen zur vereinbarten Zeit am vereinbarten Ort - natürlich nicht alle, denn wie bei echten Menschen haben manche der Bewohner:innen keine Lust auf Partys.
Möglich ist das komplexe Verhalten durch die dahinterliegende Architektur: Jeder KI-Agent verfügt über ein Gedächtnis und beobachtet, plant und reflektiert seine Umgebung und seine sozialen Beziehungen.
Diese Schleife aus Beobachtung, Planung und Reflexion treibt die Interaktionen der KI-Agenten an und bestimmt ihren Charakter. Dafür können die KI-Agenten nicht nur über ihre Beobachtungen, sondern auch über geschlossene Pläne und frühere Reflexionen nachsinnen. So entsteht zum Beispiel das Selbstbild von Klaus Müller als jemand, der sich stark in der Forschung engagiert, aus mehreren unabhängigen Beobachtungen und Reflexionen.
Damit dieser Prozess funktioniert, werden alle Elemente im Gedächtnis gespeichert und können jederzeit abgerufen werden. Um zusätzlich sicherzustellen, dass die KI-Agenten sinnvoll handeln und mit anderen Agenten interagieren, wird jede Erinnerung nach drei Aspekten bewertet: "Aktualität" weist Erinnerungen, die erst kürzlich abgerufen wurden, eine höhere Punktzahl zu. "Wichtigkeit" ist ein Wert, der zwischen banalen und wichtigen Erinnerungen unterscheidet, z.B. zwischen einem Frühstück und dem Ende einer Beziehung. "Relevanz" hingegen bewertet Erinnerungen höher, die mit der aktuellen Situation in Verbindung stehen und somit als sinnvoller Kontext für weitere Handlungen dienen.
Die komplex erscheinende Bewertungen übernimmt ChatGPT auf Basis von GPT-3.5 Turbo - im Fall der "Wichtigkeit" mit einem simplen Prompt:
Auf einer Skala von 1 bis 10, wobei 1 rein alltäglich ist (z. B. Zähneputzen, Bett machen) und 10 für extrem ergreifend ist (z. B. eine Trennung, die College), bewerten Sie die wahrscheinliche Bedeutung der folgenden Erinnerungsstücks.
Erinnerung: Lebensmitteleinkauf im The Willows Market und Apotheke
Bewertung: <Ausfüllen>
GPT-4 und "parasoziale Beziehungen"
Die Forschenden gehen davon aus, dass die Architektur mit Fortschritt großer Sprachmodelle dieselbe bleibt. Ein Wechsel etwa auf GPT-4 werde aber die Ausdruckskraft und Leistungsfähigkeit der zugrundeliegenden Prompts verbessern.
"Generative Agenten haben ein enormes Anwendungspotenzial, das über die in dieser Arbeit vorgestellte Sandbox-Demonstration hinausgeht", fassen die Forscher:innen zusammen. Mithilfe dieser Arbeit könne man etwa Foren oder VR-Welten für Social Prototyping bevölkern. In Kombination mit multimodalen KI-Modellen könnten sie außerdem sogar eine Basis für Social Robots in der physischen Welt liefern.
Wenn glaubwürdigere soziale KI-Agenten Realität werden, gibt es natürlich auch Risiken: "Ein Risiko besteht darin, dass Menschen parasoziale Beziehungen zu generativen Agenten aufbauen, auch wenn solche Beziehungen möglicherweise nicht angemessen sind", heißt es in dem Papier. Obwohl sich die Nutzer bewusst sind, dass es sich bei den Agenten um Computer handelt, "könnten sie sie vermenschlichen oder ihnen menschliche Gefühle zuschreiben".
Die Entwickler solcher Agenten sollten daher sicherstellen, dass die Agenten oder die Sprachmodelle, auf denen sie basieren, werteorientiert sind und kein Verhalten an den Tag legen, das im jeweiligen Kontext unangemessen wäre, wie zum Beispiel die Erwiderung von Liebesbekundungen".
Der Zeitraum für die Auswertung des Verhaltens war noch recht kurz, so das Team. In Zukunft müssten längere Experimente die Fähigkeiten und Einschränkungen des Ansatzes offenlegen.
Wer die Bewohner:innen von Smallville in einer zuvor berechneten Demo beobachten möchte, kann das auf dieser Seite tun.