Inhalt
newsletter Newsletter

Googles "Chimera Painter" nimmt einfache Umrisszeichnungen von Tierwesen und erstellt daraus detaillierte Bilder.

Anzeige

Googles KI-Team hat sich für seine neueste Software ein besonders naheliegendes Szenario ausgedacht: Der GAN-basierte "Chimera Painter" kann anhand von Umrissen und groben Zeichnungen von Tiermonstern, sogenannten Chimären, hochwertige Renderings erstellen.

Die Zeichnung könnt ihr in einem MS-Paint-ähnlichen Online-Werkzeug eintragen oder mit einem anderen Programm erstellen und dann hochladen. Ein Klick auf die "Transform"-Schaltfläche macht aus der Skizze eine vollwertige Zeichnung. Die folgende Animation zeigt den Prozess.

Ein wesentlicher Aspekt der Chimera-KI ist, dass sie einzelne Körperteile eines Monsters wie den Kopf, die Augen oder den Rücken segmentieren und individuell generieren kann. Bei den Skizzen stehen die verschiedenen Farben für die unterschiedlichen Körperteile.

Anzeige
Anzeige

Die grundlegende Idee hinter der Software ist, dass die Chimären-Vielfalt durch die Kombination einzelner Tierrassen viel größer ist, als ein Mensch sie jemals zeichnen könnte. Googles KI-Team generierte mit dem Chimera Painter ein Fantasy-Kartenspiel mit vielen unterschiedlichen Tierwesen.

Googles Bild-KI hilft dabei, die Vielfalt möglicher Chimären abzubilden. Die KI kann zwei oder mehrere Tiere miteinander kombinieren. | Bild: Google
Googles Bild-KI hilft dabei, die Vielfalt möglicher Chimären abzubilden. Die KI kann zwei oder mehrere Tiere miteinander kombinieren. | Bild: Google

Aufwendige Datenaufbereitung

Während die fertige KI-Software leicht zu bedienen ist und menschlichen Chimären-Zeichnern Zeit sparen könnte, war die Entwicklung des Chimera Painter ein eher aufwendiges Unterfangen.

Die Komplexität der KI-Software liegt insbesondere im Datensatz, den Googles KI-Team gemeinsam mit Künstlern erstellte: Echte Aufnahmen von Chimären existieren bekanntlich nicht und existierende CG-Datensätze erfüllen laut der Google-Forscher ihren Zweck nicht, da Probleme mit Lizenzen existiern, die Stile nicht zueinander passen und den Bildern die Vielfalt fehlt.

Googles KI-Team löste dieses Problem mit einem halbautomatischen Ansatz: Künstler erstellten zunächst einen Satz 3D-Kreaturen für jeden Kreaturentyp, die dann mit zwei Arten von Texturen überzogen wurden, einmal als Vollfarbtextur (links) und eine zweite Version mit einfachen Farben für die Segmentierung der Körperteile (rechts).

Der Datensatz für das KI-Training wurde halbautomatisiert generiert: Zunächst erstellten Künstler 3D-Chimären, die dann nach Körperteilen segmentiert und in der Unreal Engine aus vielen verschiedenen Perspektiven fotografiert wurden. | Bild: Google
Der Datensatz für das KI-Training wurde halbautomatisiert generiert: Zunächst erstellten Künstler 3D-Chimären, die dann nach Körperteilen segmentiert und in der Unreal Engine aus vielen verschiedenen Perspektiven fotografiert wurden. | Bild: Google

Diese 3D-Modelle wanderten dann in die Unreal Engine zum Foto-Shooting: Automatisierte Skripte fotografierten die 3D-Tiere in verschiedenen Posen, aus unterschiedlichen Blickwinkeln und mit zahlreichen Zoom-Stufen.

Empfehlung

So kamen mehr als 10.000 beschriftete (Klauen, Rücken, Beine, etc.) Kreaturen-Bilder zusammen für das KI-Training des GA-Netzwerks (Erklärung). In der Trainingsphase testete Google verschiedene Parameter und Modelle und verbesserte den Output des Netzwerks anhand des Feedbacks der am Projekt beteiligten Künstler. Sie wählten die aus ihrer Sicht hochwertigsten generierten Bilder aus, die dann wiederum für das KI-Training eines neuen Modells eingesetzt wurden.

Der digitale Pinsel als Assistent statt als Werkzeug

Googles KI-Team hofft, dass der Chimera Painter Künstlern die Arbeit erleichtert insbesondere bei der Ideenentwicklung. Sie könnten iterativ zeichnen, anstatt bei jeder neuen Kreatur mit dem ersten Strich zu starten. Das Projekt solle als Inspiration verstanden werden, künstlerische Tätigkeit neu zu denken und den digitalen Pinsel stärker als Assistenten zu verstehen statt als reines Werkzeug.

Die Chimera Painter Demo könnt ihr hier kostenlos im Browser ausprobieren.

Der Tech-Konzern Nvidia stellte im letzten Sommer ein ähnliches Projekt vor: Mit GauGAN können Künstler fotorealistische und fantastische Landschaften anhand einfacher Skizzen generieren. Trainiert wurde die KI mit Landschaftsaufnahmen bei Flickr. Ein Star-Wars-Zeichner demonstrierte, wie ihm GauGAN bei seiner Arbeit hilft.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Quelle: Google AI Blog

Weiterlesen über Künstliche Intelligenz

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!