Generative KI kann Texte, Audio, Bilder und zunehmend 3D-Elemente generieren. Die Gaming-Branche vereint diese Medien – und könnte deshalb besonders profitieren.
Jedenfalls vermutet das der Risikokapitalgeber Andreessen Horowitz (a16z) und ist damit nach Sequoia Capital der zweite Silicon-Valley-Großinvestor, der sich zum Potenzial generativer Künstlicher Intelligenz bekennt. In einem Blog-Beitrag legt das Unternehmen ein besonderes Augenmerk auf den Nutzen der Technologie für die Games-Branche, in der es den größten Einfluss erwartet.
Zaubertränke aus der Maschine
Die Grundlegende These der Investoren: Spiele sind die komplexeste Medienform und haben daher eine besonders hohe Einstiegshürde bei der Entwicklung. Generative KI senke diese Einstiegshürde, da sie die Komplexität in der Asset-Produktion reduziere und gleichzeitig Qualität, Quantität und Geschwindigkeit steigere.
"Künstler erstellen jetzt in wenigen Stunden hochwertige Bilder, die sonst Wochen für die manuelle Erstellung benötigen würden", schreiben die Autoren James Gwertzman und Jack Soslow. "Seit Echtzeit-3D hat es keine so revolutionäre Technologie für Spiele mehr gegeben."
Erste Gespräche mit Entwickler:innen hätten eine große Begeisterung aufgrund einer "dramatischen Reduktion" von Zeit und Kosten zutage befördert. Ein Entwickler hätte den Zeitaufwand für eine einzelne Konzeptkunst von drei Wochen auf eine Stunde reduzieren können. Der Risikokapitalgeber erwartet ähnliche Einsparquoten für die gesamte Produktions-Pipeline.
Konkrete Beispiele zeigt der Entwickler "Emm" bei Twitter. Er befasst sich mit der 2D-Asset-Produktion mit Stable Diffusion. Dafür feintunt er Stable Diffusion mit Beispiel-Assets über die Dreambooth API. So kann er Gaming-spezifische und konsistente Grafiken generieren. Mit Scenario_gg möchte er ab Dezember eine Plattform für KI-generierte Gaming-Assets anbieten.
.@Scenario_gg lets you create infinite consistent content, similar to what I described in my recent posts (swords, chests, books, characters, potions, cards & more)
Game creators can create incredible, high-quality assets in hours (vs. days or weeks using a traditional process) pic.twitter.com/14JNvBmhxF
— Emm (@emmanuel_2m) November 17, 2022
Während der produktive Einsatz von generativer KI für Konzeptkunst, 2D-Assets und Text bereits möglich ist und passiert, sind 3D-Objekte noch weiter entfernt. Erste Ansätze sind etwa Googles Forschungsprojekt Dreamfusion und Nvidias GET3D, das als Open Source verfügbar ist.
Mehr Spiele, neue Spiele und Micro-Studios
Die folgende Grafik von a16z zeigt eine Übersicht über kommerzielle Projekte und Start-ups, die sich mit generativer KI befassen, die für Gaming-Studios interessant sein könnte. Trotz aller Begeisterung stehe generative KI für Gaming ganz am Anfang, schreibt a16z. Neben großen grundlegenden Modellen wie Stable Diffusion könnten spezifisch für die Industrie entwickelte KI-Tools einen Mehrwert bringen.
Der Risikokapitalgeber erwartet, dass der Einsatz von generativer KI eine eigene berufliche Disziplin wird. Wenn generative KI Einstiegshürden senke, könne das zudem zu risikoreicheren und kreativeren Gaming-Projekten führen.
Ein weiteres mögliches Resultat der KI-Revolution könnten auf KI-Technik aufgebaute "Micro Game Studios" sein, die nur ein oder zwei Angestellte haben, aber dennoch umfangreiche und aufwendige Spiele erstellen.
Das wiederum führe zu einer noch höheren Anzahl an Spielen – das Vermarktungsproblem von Games würde so verschärft – aber womöglich auch zur Entwicklung neuer Spielideen und Genres.
Als Beispiel nennt a16z das Rollenspiel Arrowmancer, in dem Spieler:innen mit einer unendlichen Anzahl an KI-generierten Charakteren immer wieder neue Abenteuer erleben können.
Ein weiteres Beispiel ist das textbasierte RPG "AI Roguelite", bei dem sämtliche Orte, Charaktere, Feinde und Items von GPT-3 und VQGAN-CLIP generiert werden (siehe Video). Ein Pionier-Projekt beim KI-generierten Gaming ist das Text- und Bild-Adventure AI Dungeon.
Mögliche Stolpersteine sieht Andreessen Horowitz bei Copyright-Fragen. Gerade große Gaming-Studios dürften kein Interesse haben, dass ihre Assets für das Training oder Feintuning öffentlich verfügbarer KI-Modelle verwendet werden.
Stable Diffusion etwa ist mit Datensätzen trainiert, die unerlaubt Copyright-geschütztes Material integrieren. Stable-Diffusion-Miterfinder Emad Mostaque kündigte kürzlich an, dass zukünftige Trainingsdatensätze nur lizenziertes Material enthalten und eine Opt-out-Option bieten sollen.
Andreessen Horowitz sieht den Einfluss generativer KI primär im kreativen Bereich. Games-Programmierer:innen hingegen sollen weiter einen sicheren Job haben, trotz zunehmender Code-Automatisierung mit Tools wie Copilot. Die Code-Generierung benötige mehr Tests und menschliche Überprüfungen und wirke sich daher weniger stark auf die Produktivität aus.
Einen weiteren Gaming-Nutzen stiftet KI bereits beim Grafik-Rendering. Das derzeit populärste Beispiel ist Nvidias DLSS, das per KI-Upscaling aus der gleichen Hardware deutlich mehr Leistung herausholt. Eine weitere Verbreitung solcher Methoden bei zunehmender Effizienz könnte zu einer schnelleren Fortentwicklung von Echtzeit-3D-Grafik führen.
Mehr zum Thema KI für Computergrafik gibt es in unserem DEEP MINDS KI-Podcast mit Thomas Müller von Nvidia.