Inhalt
summary Zusammenfassung

OpenAI testet eine neue Benutzeroberfläche für DALL-E 3.

Anzeige

Direkt im DALL-E 3 Chatbot kann zwischen vordefinierten Stilen und einem Seitenverhältnis gewählt werden: Widescreen, 1:1 oder vertikal. Die Option erscheint oberhalb der Chat-Eingabezeile.

Wird die Option angeklickt, wird sie als Textelement in die Chat-Eingabezeile übernommen. Fährt man mit dem Mauszeiger über einen Stil, wird dieser mit einem Katzenbild vorgestellt.

Bild: Screenshot THE DECODER

Bisher verzichtete OpenAI bei DALL-E 3 gänzlich auf Steuerungsmöglichkeiten außerhalb der Texteingabe und bietet damit deutlich weniger Funktionen als die Konkurrenz von Midjourney, Stable Diffusion oder Ideogram. Das neue Feature ändert daran nicht viel, ist aber zumindest ein Hinweis darauf, dass OpenAI noch an der DALL-E Oberfläche arbeitet.

Anzeige
Anzeige

DALL-E 2 hatte eine eigene Benutzeroberfläche, die auch Funktionen wie Out- und Inpainting anbot, also das Hinzufügen von Text zu einem Bild oder das Ändern eines Elements im Bild.

Kopf-an-Kopf-Rennen bei Bild-KI

Über die API bietet DALL-E 3 mehr visuelle Vielfalt: Es gibt zwei grundlegende Betriebsmodi, "natural" und "vivid", die entweder natürliche, realistische oder hyperrealistische, dramatische Inhalte erzeugen. Zwei weitere Qualitätsmodi sind "HD" und "Standard". Der HD-Modus soll mehr Details darstellen und dem Prompt genauer folgen, ist aber teurer und dauert länger.

DALL-E 3 folgt Prompts genauer als vergleichbare Systeme. Allerdings haben insbesondere Midjourney und Ideogram mit den letzten Updates aufgeholt, und bieten oft eine bessere Bildqualität, insbesondere Midjourney, und deutlich mehr Einstellungsmöglichkeiten. Ideogram kann Schriften besser rendern als Midjourney und DALL-E 3. Das neue Stable Diffusion 3 soll Text besser folgen.

Ein Vorteil von DALL-E: OpenAI hat den C2PA-Standard implementiert, der Metadaten in die generierten Bilder einbettet, um deren Herkunft zu verifizieren. Die Metadaten können auf bestimmten Webseiten und von Social-Media-Plattformen ausgelesen werden. Ferner arbeitet OpenAI an einem Bildklassifikator, der DALL-E-Bilder verlässlich erkennt.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • OpenAI testet eine neue Benutzeroberfläche für DALL-E 3, die es ermöglicht, zwischen vordefinierten Stilen und Seitenverhältnissen (Widescreen, 1:1 oder vertikal) zu wählen.
  • Die Optionen erscheinen oberhalb der Chat-Eingabezeile. Bisher bot DALL-E 3 weniger Funktionen als seine Konkurrenten Midjourney, Stable Diffusion oder Ideogram. Das neue Feature zeigt, dass OpenAI weiter an der Benutzeroberfläche arbeitet.
  • Im Vergleich zu anderen Bild-KI-Systemen befolgt DALL-E 3 die Prompts zwar genauer, aber Midjourney und Ideogram bieten mehr Bildqualität und Einstellungsmöglichkeiten.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!