Inhalt
newsletter Newsletter
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
Künstliche Intelligenz und Robotik | DEEP MINDS #15

OpenAIs DALL-E 2 zeigt beeindruckende KI-Kreativität – wenn ihr wisst, wie ihr sie steuern könnt. Eine kleine Tour durch DALL-E 2.

Seit knapp zwei Wochen habe ich Zugang zu DALL-E 2 und konnte die Künstliche Intelligenz ausführlich testen. Mein Zwischenfazit: OpenAIs DALL-E 2 ist das aktuell beste verfügbare KI-System für Bildgenerierung und -veränderung.

Mit DALL-E 2 könnt ihr mit einer einfachen Textbeschreibung Fotografien, Illustrationen, Gemälde oder 3D-Kunst generiert werden, deren Qualität immer wieder Profi-Niveau erreichen. Alternativen wie Midjourney entstehen gerade, erreichen jedoch noch nicht die Qualität von DALL-E 2.

Welcher Prompt steckt hinter diesem Motiv? Ratet in den Kommentaren. | Bild: Generiert mit DALL-E 2 by OpenAI

Im Folgenden möchte ich euch einen kurzen Einblick in die Funktionen von DALL-E 2 und die hohe Kunst des Prompt-Designs geben.

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung

OpenAI DALL-E 2 kann Bilder generieren, bearbeiten oder variieren

Die Benutzeroberfläche von DALL-E 2 ist simpel gehalten: Über ein Eingabefeld kann euer Text-Bildbefehl, der sogenannte „Prompt“, eingefügt und per Druck auf „Generate“ an das KI-System geschickt werden. Nach einer kurzen Wartezeit gibt es dann vier generierte Bilder zu sehen.

Die Bedienung ist simpel: IHr schreibt Text in ein Textfeld. Die Eingaben können kurz oder sehr ausführlich sein.

Unter dem Eingabefeld kann alternativ ein eigenes Bild hochgeladen werden – sofern es keine echte Person zeigt. Von solchen und neu generierten Bildern kann DALL-E 2 Varianten erzeugen. Das macht es relativ leicht, von existierenden Motiven inspirierte Bilder zu generieren, die dann weiterverarbeitet werden können. Das KI-System lässt sich so genauer steuern.

Ein Klick auf ein Bild öffnet die Detailansicht. Hier können Variationen erstellt oder das Bild bearbeitet werden.

Zudem kann über die Bearbeitungsfunktion ein Bereich im Bild markiert werden, der anschließend von DALL-E 2 verändert werden kann. Dafür muss das gewünschte Ergebnis einfach per Text-Prompt beschrieben werden.

Der zu bearbeitende Bereich kann mit einem Pinsel markiert werden.

DALL-E 2 generiert anschließend drei Varianten des Originals, die die entsprechenden Änderungen enthalten. Hier habe ich der Statue einen schicken Schnurres hinzugefügt.

Ein Mustache für einen griechischen Philosophen? Für DALL-E 2 kein Problem.

OpenAI DALL-E 2 und das Prompt-Design

Wie am Beispiel der antiken Büste des griechischen VR-Pioniers bereits deutlich wird, lässt sich DALL-E 2 erstaunlich detailliert über die Texteingabe steuern. OpenAI hat das KI-System mit über 650 Millionen Bildern trainiert – DALL-E 2 hat also zahlreiche Motive, Stile, Belichtungen und andere Bildeigenschaften gesehen und kann diese häufig reproduzieren.

Empfehlung

Mit dem sogenannten Prompt-Design – also dem Design der passenden Textbeschreibung – lassen sich mit DALL-E 2 etwa fotorealistische Bilder mit unterschiedlichen Objektivangaben generieren, um kleine Brennweiten oder Bewegungsunschärfe zu simulieren.

DALL-E 2 kann den Bildstil verschiedene Kameras reproduzieren, hier Polaroid.

Mit den richtigen Beschreibungen lassen sich zudem Stimmungen einfangen, Strukturen oder Größenverhältnisse festlegen, Stile wie Steampunk oder Cyberpunk reproduzieren, Kamerawinkel und Belichtung bestimmen oder das Design von TV-Serien oder Filmen als Vorlage nehmen.

Zahlreiche Illustrationsstile kann DALL-E 2 ebenfalls reproduzieren, ebenso 3D-Kunst oder historische Gemälde. Diese Fähigkeit zur Imitation von Stilen zeigt DALL-E 2 auch für zahlreiche Stile der Kunstgeschichte, einzelne Künstler:innen oder spezielle Werke.

Dank umfassendem Training kann DALL-E 2 auch Stile wie Steampunk reproduzieren.
DALL-E 2 kann zudem den Stil einzelner Künstler:innen oder Gemälde imitieren.

Wer den Stil eines bestimmten Kunstwerks oder Künstler:in einfangen will, kann dazu ebenfalls KI-Hilfe in Anspruch nehmen: Im sogenannten Unbundling stellen erste DALL-E-2-Nutzer:innen der Text-KI GPT-3 die Aufgabe, Charakteristika und den Stil eines Gemäldes zu beschreiben. Die umfassende KI-Antwort kann dann für das Prompt-Design genutzt werden.

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Neben antiken Büsten kann DALL-E 2 auch andere Objekte generieren – von Stickerei, über Statuen, Körper, Kuscheltiere, Architektur oder Designer-Stühlen ist alles dabei.

Halb Hund, halb Jedi, halb griechischer Philosoph – DALL-E 2 beeindruckt mit sinnvollen Interpretationen.

DALL-E 2: Externe Bildbearbeitung, Prompt-Design und Bearbeitungsfunktion

Mit der bereits vorgestellten Bearbeitungsfunktion lassen sich Details im Bild verändern, etwa ein Schnurrbart hinzufügen, Objekte oder der gesamte Hintergrund austauschen.

Da sich die generierten Bilder auch herunterladen lassen, kann mit einem externen Bildbearbeitungsprogramm noch mehr aus DALL-E 2 herausgeholt werden. In der einfachsten Variante kann so etwa unsere Büste des griechischen Philosophen verkleinert und als Grundlage für ein neues Bild genutzt werden.

Mit simplen Tricks lassen sich die Bilder weiter bearbeiten. Hier etwa eine passende Statue zum Kopf generieren.

Mit der gleichen Methode lassen sich Gemälde ergänzen. So kann DALL-E 2 Mona Lisa einen Körper geben und unser griechischer VR-Philosoph bekommt Gesellschaft.

DALL-E 2 ergänzt den Torso und die Umgebung des VR-Philosophen passend im gewünschten Stil. Mit weiteren Veränderungen lassen sich die Ergebnisse verfeinern.

Wer diesen Prozess häufig wiederholt, kann immer weiter aus dem Bild zoomen – manche Künstler:innen erzeugen damit bereits beeindruckende Reisen durch DALL-E-2-Welten oder riesige „Wandgemälde“.

Die Kombination aus externer Bildbearbeitung, intelligentem Prompt-Design und der Bearbeitungsfunktion von DALL-E 2 lassen noch zahlreiche andere Anwendungen zu.

Wer tiefer einsteigen will, sollte sich das DALL-E 2 Prompt Book von Guy Parsons anschauen. Das gibt eine umfassende Übersicht über viele der bisher entdeckten Prompt-Designs und zusätzliche Methoden, um das Beste aus DALL-E 2 herauszuholen.

Innerhalb der kommenden Wochen sollen rund eine Million Menschen Zugriff auf DALL-E 2 erhalten. Das verkündete OpenAI kürzlich zusammen mit den Preisen für DALL-E 2 beim Start in die Beta-Phase.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!