Inhalt
summary Zusammenfassung

Ideogram hat sein bisher fortschrittlichstes Text-zu-Bild-Modell, Ideogram 1.0, veröffentlicht, das sich durch Textdarstellung, Fotorealismus, verbessertes Prompt-Following und eine neue Funktion namens Magic Prompt von der Konkurrenz abheben soll.

Anzeige

Bild-KIs sind bisher nicht gut darin, Text innerhalb von KI-generierten Bildern korrekt darzustellen. Ideogram 1.0 löst dieses Problem mit zuverlässigen Text-Rendering-Funktionen, mit denen laut Ideogram personalisierte Nachrichten, Memes, Poster, T-Shirt-Designs, Geburtstagskarten, Logos und mehr erstellt werden können.

Das Unternehmen behauptet, dass Ideogram 1.0 die Textfehlerrate im Vergleich zu DALL-E 3 um fast die Hälfte reduziert. Midjourney ist bei der Textdarstellung noch schwächer als DALL-E 3.

Ideogram ist beim Text-Rendering nicht perfekt, soll aber DALL-E 3 und Midjourney deutlich übertreffen. Erste Tests bestätigen das. | Bild: Ideogram

In Vergleichstests hätten Benutzerinnen und Benutzer mit Ideogram erzeugte Bilder in allen Bereichen besser bewertet als mit DALL-E 3 und Midjourney v6 erzeugte Bilder.

Anzeige
Anzeige
In von Ideogram durchgeführten Benchmarks bewerteten Menschen mit Ideogram generierte Bilder besser als mit DALL-E 3 und Midjourney generierte Bilder. | Bild: Ideogram

Ideogram ist in der Lage, Bilder in einem breiten Spektrum von Seitenverhältnissen und Stilen zu erzeugen, von fotorealistischen hin zu eher künstlerischen Ergebnissen, und soll auch lange und komplexe Prompts gut umzusetzen.

Die Funktion "Magic Prompt" schreibt, ähnlich wie bei OpenAIs DALL-E, einen kurzen Prompt automatisch in eine detaillierte Bildbeschreibung um. Bei Ideogram kann man dieses Umschreiben allerdings ausstellen, bei DALL-E 3 geht es nicht.

Ein erster Test zeigt, dass Ideogram sich in der Bildqualität nicht hinter Midjourney verstecken muss und bei exakter Umsetzung des Prompts sogar leichte Vorteile gegenüber Midjourney v6 und DALL-E 3 haben könnte.

Bei der Textgenerierung ist Ideogram deutlich im Vorteil, wenn auch nicht perfekt, insbesondere wenn mehrere Texte in einem Bild enthalten sein sollen. Präzise Infografiken beispielsweise können mit Ideogram weiterhin nicht erzeugt werden.

Prompt: "The letters "SORA" being generated on a digital screen" | Bild: Midjourney
Prompt: "The letters "SORA" being generated on a digital screen" - Ideogram setzt den Prompt besser um und schreibt SORA jedesmal korrekt. | Bild: Ideogram prompted by THE DECODER

In Bildqualität und Komposition übertreffen Midjourney und Ideogram das oft kitschig-bunte DALL-3 von OpenAI. Midjourney bietet von allen drei Anbietern derzeit noch die meisten Funktionen zur Bildbearbeitung, etwa die Veränderung einzelner Elemente im Bild per Textbefehl.

Empfehlung
Prompt: "The letters "SORA" being generated on a digital screen" | Bild: DALL-E 3

Die neue Version von Ideogram steht ab sofort allen Interessierten auf ideogram.ai zur Verfügung und kann mit einem Account kostenlos getestet werden. Kostenpflichtige Abonnements bieten bevorzugte Generierung, private Generierung, Bildupload und Zugang zum Ideogram Editor.

Darüber hinaus gibt Ideogram eine zusätzliche Serie-A-Finanzierung in Höhe von 80 Millionen US-Dollar unter der Führung von Andreessen Horowitz bekannt.

Weitere Partner in dieser Finanzierungsrunde sind der bestehende Investor Index Ventures sowie die neuen Investoren Redpoint Ventures, Pear VC und SV Angel. Martin Casado, General Partner bei Andreessen Horowitz, wird dem Aufsichtsrat von Ideogram beitreten.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Ideogram hat sein fortschrittlichstes Text-zu-Bild-Modell, Ideogram 1.0, vorgestellt, das sich durch eine präzisere Textdarstellung, höheren Fotorealismus und ein verbessertes Prompt-Following auszeichnet.
  • Ideogram 1.0 reduziert die Textfehlerrate im Vergleich zu DALL-E 3 um fast die Hälfte und kann personalisierte Nachrichten, Memes, Poster, T-Shirt-Designs, Geburtstagskarten, Logos und vieles mehr erstellen.
  • Das Unternehmen hat außerdem eine Serie-A-Finanzierung in Höhe von 80 Millionen US-Dollar unter der Führung von Andreessen Horowitz bekannt gegeben, wobei Martin Casado, General Partner bei Andreessen Horowitz, dem Aufsichtsrat von Ideogram beitreten wird.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!