OpenAI testet eine neue Benutzeroberfläche für DALL-E 3.
Direkt im DALL-E 3 Chatbot kann zwischen vordefinierten Stilen und einem Seitenverhältnis gewählt werden: Widescreen, 1:1 oder vertikal. Die Option erscheint oberhalb der Chat-Eingabezeile.
Wird die Option angeklickt, wird sie als Textelement in die Chat-Eingabezeile übernommen. Fährt man mit dem Mauszeiger über einen Stil, wird dieser mit einem Katzenbild vorgestellt.
Bisher verzichtete OpenAI bei DALL-E 3 gänzlich auf Steuerungsmöglichkeiten außerhalb der Texteingabe und bietet damit deutlich weniger Funktionen als die Konkurrenz von Midjourney, Stable Diffusion oder Ideogram. Das neue Feature ändert daran nicht viel, ist aber zumindest ein Hinweis darauf, dass OpenAI noch an der DALL-E Oberfläche arbeitet.
DALL-E 2 hatte eine eigene Benutzeroberfläche, die auch Funktionen wie Out- und Inpainting anbot, also das Hinzufügen von Text zu einem Bild oder das Ändern eines Elements im Bild.
Kopf-an-Kopf-Rennen bei Bild-KI
Über die API bietet DALL-E 3 mehr visuelle Vielfalt: Es gibt zwei grundlegende Betriebsmodi, "natural" und "vivid", die entweder natürliche, realistische oder hyperrealistische, dramatische Inhalte erzeugen. Zwei weitere Qualitätsmodi sind "HD" und "Standard". Der HD-Modus soll mehr Details darstellen und dem Prompt genauer folgen, ist aber teurer und dauert länger.
DALL-E 3 folgt Prompts genauer als vergleichbare Systeme. Allerdings haben insbesondere Midjourney und Ideogram mit den letzten Updates aufgeholt, und bieten oft eine bessere Bildqualität, insbesondere Midjourney, und deutlich mehr Einstellungsmöglichkeiten. Ideogram kann Schriften besser rendern als Midjourney und DALL-E 3. Das neue Stable Diffusion 3 soll Text besser folgen.
Ein Vorteil von DALL-E: OpenAI hat den C2PA-Standard implementiert, der Metadaten in die generierten Bilder einbettet, um deren Herkunft zu verifizieren. Die Metadaten können auf bestimmten Webseiten und von Social-Media-Plattformen ausgelesen werden. Ferner arbeitet OpenAI an einem Bildklassifikator, der DALL-E-Bilder verlässlich erkennt.