Inhalt
summary Zusammenfassung

Das neue Text-zu-Bild-System DALL-E 3 von OpenAI bietet deutliche Verbesserungen gegenüber dem Vorgängermodell und ist nativ in ChatGPT integriert. Diese Integration soll laut OpenAI das sogenannte "Prompt Engineering" überflüssig machen.

Anzeige

Laut OpenAI zeigt DALL-E 3 signifikante Fortschritte in seiner Fähigkeit, Bilder zu generieren, die exakt komplizierten Prompts folgen. Dazu gehört die präzise Darstellung einer Szene mit spezifischen Objekten, ihren Beziehungen untereinander und Detailaspekten wie menschlichen Händen oder Text im Bild, typische Schwachstellen bisheriger Text-zu-Bild-Systeme.

"An illustration of a human heart made of translucent glass, standing on a pedestal amidst a stormy sea. Rays of sunlight pierce the clouds, illuminating the heart, revealing a tiny universe within. The quote 'Find the universe within you' is etched in bold letters across the horizon." | Bild: DALL-E 3 prompted by OpenAI

DALL-E 3 unterstützt, wie DALL-E 2 und andere Text-zu-Bild-Systeme, eine Vielzahl von Stilen, von künstlerisch abstrakt über Comiczeichnungen bis zum Fotorealismus.

"Close-up photograph of a hermit crab nestled in wet sand, with sea foam nearby and the details of its shell and texture of the sand accentuated." | Bild: DALL-E 3 prompted by OpenAI

DALL-E 3 wird zur ChatGPT-App

Eine weitere Neuerung ist, dass DALL-E 3 zu einer ChatGPT-Anwendung für zahlende ChatGPT-Plus-Benutzer wird. Laut OpenAI kann ChatGPT als Prompt-Partner für DALL-E 3 eingesetzt werden, um Brainstormings zu unterstützen und Prompts zu optimieren.

Anzeige
Anzeige

Wenn das resultierende Bild nahe, aber nicht genau wie gewünscht ist, kann es über ChatGPT mit gezielten Anweisungen verbessert werden. Diese dialogische Bildgenerierung soll laut OpenAI den Bedarf an komplizierten Prompts reduzieren. Die Firma schreibt im Original, dass kompliziertes "Prompt Engineering" nicht mehr notwendig sei.

Video: OpenAI

Alle Bilder, die mit DALL-E 3 erzeugt werden, gehören vollständig ihren Urhebern. Die Bilder können wiederverwendet, vermarktet und verkauft werden.

Die Einführung in ChatGPT-Plus, ChatGPT Enterprise und via API ist für Oktober geplant. Eine eigenständige Version von DALL-E 3 über OpenAI Labs, ähnlich DALL-E 2, soll im Laufe des Herbstes folgen.

OpenAI bietet Künstlern ein Opt-Out ihrer Werke - für ein zukünftiges Modell

Eine große Änderung und Einschränkung im Vergleich zu bestehenden Bildsystemen ist, dass DALL-E 3 Prompts ablehnt, die Namen lebender Künstlerinnen und Künstler enthalten. Das ist in anderen Bildsystemen eine beliebte Methode, um dem Bildsystem eine stilistische Richtung zu geben.

Empfehlung

Darüber hinaus haben Künstlerinnen und Künstler die Möglichkeit, ihre Bilder vom Training zukünftiger (!) Bildmodelle auszuschließen. Dies wiederum könnte bedeuten, dass DALL-E 3 immer noch mit den Werken dieser Künstlerinnen und Künstler trainiert wird, was zu weiteren Copyright-Diskussionen führen könnte. Möglicherweise kann OpenAI nach Opt-out-Phasen aktualisierte Versionen von DALL-E 3 zur Verfügung stellen.

Auch Prompts mit Namen bekannter Personen sollen aus Sicherheitsgründen abgelehnt werden, um zu verhindern, dass z.B. KI-generierte Bilder von Politikern wie bei Midjourney um die Welt gehen. Diesen und weiteren Risiken wie visueller Über- oder Unterrepräsentation oder dem Missbrauch für Propaganda will OpenAI unter anderem mit Red-Teaming-Verfahren begegnen. Ebenso testet OpenAI intern ein Tool, das erkennen soll, ob ein Bild mit DALL-E 3 erzeugt wurde.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • DALL-E 3, das neueste Text-zu-Bild-System von OpenAI, bietet im Vergleich zu seinem Vorgänger DALL-E 2 erhebliche Verbesserungen bei der Generierung von Bildern aus Text.
  • DALL-E 3 ist neu in ChatGPT integriert, das als Brainstorming-Partner fungiert, Prompts verfeinert und präzise Anpassungen im generierten Bild ermöglicht, ohne dass umfangreiche Prompt-Kenntnisse erforderlich sind.
  • Zusätzlich zu den visuellen Verbesserungen legt OpenAI Wert auf Sicherheitsfunktionen wie Prompt-Sperren für die Namen bekannter Personen und berücksichtigt besser die Rechte von Künstlern, indem die Generierung von Bildern im Stil lebender Künstler blockiert wird und ein Opt-Out aus den Trainingsdaten zukünftiger Modelle ermöglicht wird.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!