OpenAIs DALL-E 2 zeigt beeindruckende KI-Kreativität – wenn ihr wisst, wie ihr sie steuern könnt. Eine kleine Tour durch DALL-E 2.
Seit knapp zwei Wochen habe ich Zugang zu DALL-E 2 und konnte die Künstliche Intelligenz ausführlich testen. Mein Zwischenfazit: OpenAIs DALL-E 2 ist das aktuell beste verfügbare KI-System für Bildgenerierung und -veränderung.
Mit DALL-E 2 könnt ihr mit einer einfachen Textbeschreibung Fotografien, Illustrationen, Gemälde oder 3D-Kunst generiert werden, deren Qualität immer wieder Profi-Niveau erreichen. Alternativen wie Midjourney entstehen gerade, erreichen jedoch noch nicht die Qualität von DALL-E 2.

Im Folgenden möchte ich euch einen kurzen Einblick in die Funktionen von DALL-E 2 und die hohe Kunst des Prompt-Designs geben.
OpenAI DALL-E 2 kann Bilder generieren, bearbeiten oder variieren
Die Benutzeroberfläche von DALL-E 2 ist simpel gehalten: Über ein Eingabefeld kann euer Text-Bildbefehl, der sogenannte „Prompt“, eingefügt und per Druck auf „Generate“ an das KI-System geschickt werden. Nach einer kurzen Wartezeit gibt es dann vier generierte Bilder zu sehen.

Unter dem Eingabefeld kann alternativ ein eigenes Bild hochgeladen werden – sofern es keine echte Person zeigt. Von solchen und neu generierten Bildern kann DALL-E 2 Varianten erzeugen. Das macht es relativ leicht, von existierenden Motiven inspirierte Bilder zu generieren, die dann weiterverarbeitet werden können. Das KI-System lässt sich so genauer steuern.

Zudem kann über die Bearbeitungsfunktion ein Bereich im Bild markiert werden, der anschließend von DALL-E 2 verändert werden kann. Dafür muss das gewünschte Ergebnis einfach per Text-Prompt beschrieben werden.

DALL-E 2 generiert anschließend drei Varianten des Originals, die die entsprechenden Änderungen enthalten. Hier habe ich der Statue einen schicken Schnurres hinzugefügt.

OpenAI DALL-E 2 und das Prompt-Design
Wie am Beispiel der antiken Büste des griechischen VR-Pioniers bereits deutlich wird, lässt sich DALL-E 2 erstaunlich detailliert über die Texteingabe steuern. OpenAI hat das KI-System mit über 650 Millionen Bildern trainiert – DALL-E 2 hat also zahlreiche Motive, Stile, Belichtungen und andere Bildeigenschaften gesehen und kann diese häufig reproduzieren.
Mit dem sogenannten Prompt-Design – also dem Design der passenden Textbeschreibung – lassen sich mit DALL-E 2 etwa fotorealistische Bilder mit unterschiedlichen Objektivangaben generieren, um kleine Brennweiten oder Bewegungsunschärfe zu simulieren.

Mit den richtigen Beschreibungen lassen sich zudem Stimmungen einfangen, Strukturen oder Größenverhältnisse festlegen, Stile wie Steampunk oder Cyberpunk reproduzieren, Kamerawinkel und Belichtung bestimmen oder das Design von TV-Serien oder Filmen als Vorlage nehmen.
Zahlreiche Illustrationsstile kann DALL-E 2 ebenfalls reproduzieren, ebenso 3D-Kunst oder historische Gemälde. Diese Fähigkeit zur Imitation von Stilen zeigt DALL-E 2 auch für zahlreiche Stile der Kunstgeschichte, einzelne Künstler:innen oder spezielle Werke.


Wer den Stil eines bestimmten Kunstwerks oder Künstler:in einfangen will, kann dazu ebenfalls KI-Hilfe in Anspruch nehmen: Im sogenannten Unbundling stellen erste DALL-E-2-Nutzer:innen der Text-KI GPT-3 die Aufgabe, Charakteristika und den Stil eines Gemäldes zu beschreiben. Die umfassende KI-Antwort kann dann für das Prompt-Design genutzt werden.
Neben antiken Büsten kann DALL-E 2 auch andere Objekte generieren – von Stickerei, über Statuen, Körper, Kuscheltiere, Architektur oder Designer-Stühlen ist alles dabei.

DALL-E 2: Externe Bildbearbeitung, Prompt-Design und Bearbeitungsfunktion
Mit der bereits vorgestellten Bearbeitungsfunktion lassen sich Details im Bild verändern, etwa ein Schnurrbart hinzufügen, Objekte oder der gesamte Hintergrund austauschen.
Da sich die generierten Bilder auch herunterladen lassen, kann mit einem externen Bildbearbeitungsprogramm noch mehr aus DALL-E 2 herausgeholt werden. In der einfachsten Variante kann so etwa unsere Büste des griechischen Philosophen verkleinert und als Grundlage für ein neues Bild genutzt werden.

Mit der gleichen Methode lassen sich Gemälde ergänzen. So kann DALL-E 2 Mona Lisa einen Körper geben und unser griechischer VR-Philosoph bekommt Gesellschaft.

Wer diesen Prozess häufig wiederholt, kann immer weiter aus dem Bild zoomen – manche Künstler:innen erzeugen damit bereits beeindruckende Reisen durch DALL-E-2-Welten oder riesige „Wandgemälde“.
Worlds Within Worlds #aiart #dalle2 #aianimation #animation #dalle #infinitezoom #loop #fantasy #scifi pic.twitter.com/LB8eo2GZof
— Michael Carychao (@MichaelCarychao) May 22, 2022
Inpainting with DALL·E 2 is super fun. With some ingenuity, you can create arbitrarily large artwork like the murals shown below – which I assume are the largest #dalle-produced images created so far. pic.twitter.com/DDQUMSmgYq
— David Schnurr (@_dschnurr) April 19, 2022
Die Kombination aus externer Bildbearbeitung, intelligentem Prompt-Design und der Bearbeitungsfunktion von DALL-E 2 lassen noch zahlreiche andere Anwendungen zu.
Wer tiefer einsteigen will, sollte sich das DALL-E 2 Prompt Book von Guy Parsons anschauen. Das gibt eine umfassende Übersicht über viele der bisher entdeckten Prompt-Designs und zusätzliche Methoden, um das Beste aus DALL-E 2 herauszuholen.
Innerhalb der kommenden Wochen sollen rund eine Million Menschen Zugriff auf DALL-E 2 erhalten. Das verkündete OpenAI kürzlich zusammen mit den Preisen für DALL-E 2 beim Start in die Beta-Phase.