KI in der Praxis

KI-Kunst per Knopfdruck - diese App macht süchtig

Matthias Bastian
Eine verträumte Küstenstadt abstrakt gezeichnet.

Wombo Dream / MIXED

Wombo AI meldet sich mit "Wombo Dream" zurück, einer KI-Kunst-App, die auf Knopfdruck surreale hochauflösende Bilder generiert - und dabei ziemlich genau offenlegt, welche Bilder Bestandteil des Trainingsmaterials waren.

Der erste große Wurf gelang dem kanadischen Entwicklungsteam Wombo AI mit der Deepfake-App Wombo: Sie animiert ein Foto eures Gesichts lippensynchron zu einem Song - inklusive maximal peinlicher Tanzbewegungen. Wombo wurde innerhalb kürzester Zeit Millionen Mal heruntergeladen und gehört zu den ersten großen westlichen Ein-Klick-Deepfake-Apps.

Wombo Dream: KI-Kunst mit einem Klick

Mit Wombo Dream stellt Wombo AI jetzt die zweite KI-Kunst-App vor: Sie generiert basierend auf einer Texteingabe von bis zu 100 Zeichen ein passendes Bild. KI-Puristen wählen die nackte Bildausgabe ohne zusätzlichen Bildstil - hier erlebt man ungefiltert die typisch hohe Abstraktionsebene von KI-Kunst mit teils starkem Kringel- und Horrorfaktor.

Ungefilterte KI-Kunst ist mitunter etwas hart für die Augen - hier ein Wiener Würstchen gepaart mit Max. | Bild: Wombo Dream / MIXED

 

Eine etwas präzisere Bildbeschreibung mit "Dog" dazu sowie einem ergänzenden Filter erzeugt ein Bild, das man sich an die Wand hängen könnte. Wiener Dog und Wiener Würstchen sind klar erkennbar. | Bild: Wombo Dream / MIXED

Im ungefilterten Modus lässt sich außerdem deutlich herauslesen, welche Bilder Bestandteil des KI-Trainings waren. Nach meinen ersten Tests sind das ziemlich viele: Von Band-Logos über bekannte Fußballer bis hin zu Geschlechtsteilen kann Wombos Traum-KI so ziemlich jedes Wort mit Wiedererkennungswert abstrakt als Bild zurecht fantasieren. Jede neue Eingabe erzeugt ein neues Motiv - das macht süchtig.

Das "Metallica"-Logo war offensichtlich Bestandteil der KI-Trainingsdaten. | Bild: Wombo AI / MIXED

Ihr könnt die KI-Generierung mit einem der zahlreichen Bildstile wie "Dark Fantasy" oder "Steampunk" in eine etwas konkretere Richtung lenken. Die Stile beeinflussen Zeichenart, Farbgebung und Aufbau des Bildes. Bei Steampunk etwa generiert die KI meist Motive, die an komplexe Gebäude oder Maschinen erinnern, das zum Wort eingegebene Motiv aber dennoch widerspiegeln.

Der Input "Metallica" in Kombination mit einem Filter erzeugt ein surreales Bühnenbild statt des Logos. Man erkennt Sänger, Gitarren und ein Schlagzeug. | Bild: Wombo AI / MIXED.de

GAN-Architektur ist Betriebsgeheimnis

Welche Technologie genau Wombo Dream verwendet, verrät das Entwicklungsstudio nicht. Schließen wir den unwahrscheinlichen Fall einer kompletten Eigenentwicklung aus, hat Wombo AI womöglich ein gelungenes Interface um OpenAIs KI-Modell CLIP mit VQGAN oder um ein ähnliches Modell gebaut. Mit zusätzlichen Trainingsdaten könnte Wombo AI das Modell für die verschiedenen Stile feinjustiert haben oder die Stile sind bereits im Datensatz enthalten.

Die von Wombo verwendete zugrundeliegende KI-Software ist als Open Source verfügbar, allein es fehlte an einer für alle leicht bedienbaren Oberfläche. Die hat Wombo AI mit der Dream-App geschaffen - und das kommt an: Im Google Play Store und in Apples App Store erzielt Dream hohe Bewertungen. Im App Store schießt die App auf Platz Nr. 1 in der Rubrik Grafik und Design. Alternativ könnt ihr Wombo Dream im Browser testen.

Derzeit ist Wombo Dream noch werbefrei und die Bildgenerierung ist schnell und kostenlos. Das dürfte nicht so bleiben.

Weiterlesen und hören über KI-Kunst: