Ein Team von Ex-Googlern will eines der zahlreichen Forschungsprojekte zu generativer KI zur Marktreife bringen und positioniert sich als Mitbewerber für Midjourney.
Ideogram AI tut, was Google nicht tut: Nämlich die hochwertige KI-Forschung des Suchgiganten zur generativen KI in ein Produkt zu überführen. Ideogram AI hat eine Seed-Finanzierung in Höhe von 16,5 Millionen Euro erhalten, unter anderem von a16z und Indexventures.
Das Team von Ideogram besteht aus ehemaligen Angestellten von Google Brain, UC Berkeley, Carnegie Mellon University und der University of Toronto. Dort haben sie an Projekten wie Googles Bild-KI Imagen oder Imagen Video und vielen weiteren KI-Technologien gearbeitet.
Ideogram v0.1 geht in die Beta-Phase
Mit "Ideogram v0.1" stellt Ideogram AI nun eine erste Beta-Version einer Text-zu-Bild-Software vor, die im Gegensatz zu Midjourney direkt im Browser läuft. In der Ideogram-Community kann man sich bereits zahlreiche Beispiele der Generierung inklusive Prompts anschauen. Wie Midjourney unterstützt auch IdeogramAI viele Stile, von fotorealistisch bis fantastisch abstrakt.
Auf den ersten Blick scheint die Plattform hinsichtlich Vielfalt, Genauigkeit und Detaillierungsgrad mindestens auf dem Niveau von Midjourney zu liegen. Ihre Stärke liegt auch in der Schriftgenerierung, eine Fähigkeit, die Google in den bisherigen Text-zu-Bild-Prototypen unter Beweis gestellt hat, und die bestehenden Text-zu-Bild-Systemen weitgehend fehlt.
Interessant ist auch, dass Ideogram AI die Webplattform direkt als soziales Netzwerk mit eigenen Profilen und Handle denkt. So ist es möglich, die Generierung einer anderen Person, Bild und Prompt, aufzunehmen und daraus ein neues Bild zu erstellen. Das könnte die Bildgenerierung weiter vereinfachen.
Details über die verwendete Technologie und ein Preismodell sind bisher nicht bekannt. Interessenten können sich auf eine Warteliste setzen lassen. Sie ist per Google-Login zugänglich. Viele weitere Bildbeispiele finden sich auf Twitter unter dem Hashtag "#ideogram".
Google und kommerzielle generative KI-Systeme - es ist kompliziert
Google zeigte schon im Mai 2022 mit Imagen ein Text-zu-Bild-System, das damals OpenAIs DALL-E 2 deutlich übertraf. Später folgten Parti, Re-Imagen und Muse, die noch detailliertere, bessere und schnellere Bilder passend zum Prompt generieren konnten.
Besonderheit: die realistische Darstellung von Text, an der alle bisherigen Bild-KI-Systeme noch scheitern. Googles Systeme sind in der Lage, Text aus Prompts exakt zu übernehmen und als Font ins Bild zu setzen. Genau diese Fähigkeit zeigt nun auch Ideogram.
Bisher ist es Google jedoch nicht gelungen, ein mit Midjourney oder DALL-E vergleichbares Projekt zur Marktreife zu bringen. In den USA läuft ein zaghafter Betatest mit Imagen, mehr aber auch nicht.
Vermutlich ist das Geschäftsfeld für den Suchgiganten einfach zu klein und die Technologie wird eher in bestehende Software wie die Android-Bildbearbeitung integriert. Ideogram könnte sich ähnlich wie Midjourney erfolgreich in der Nische der Bildgenerierung positionieren.