Inhalt
summary Zusammenfassung

Nachdem zuletzt Ideogram und Flux Geschwindigkeit und Genauigkeit bei KI-Bildern verbessert haben, gibt es jetzt einen neuen Benchmark: Recraft V3.

Anzeige

Das KI-Startup Recraft hat ein neues Bildgenerierungsmodell vorgestellt, das nach eigenen Angaben neue Maßstäbe in der KI-Bildgenerierung setzt. Für diese Aussage gibt es auch einen unabhängigen Beleg: Recraft V3 belegt im Hugging Face Benchmark für Text-zu-Bild-Modelle mit einem ELO-Wert von 1172 den ersten Platz vor den neuesten Modellen Flux und Ideogram.

Laut Recraft ist das eigene neueste Modell am besten bei der Generierung von Text in Bildern, der anatomischen Genauigkeit, dem Verständnis von Prompts und der ästhetischen Qualität. Das Modell soll zudem lange Texte am Stück korrekt rendern können, aktuellen Modellen gelingt das nur bei wenigen Worten.

Werbebanner für Recraft V3 mit türkisfarbener Schrift auf orangem Hintergrund, beschreibt Textgenerierungsfähigkeiten.
Eine besondere Stärke von Recraft V3 liegt nach Unternehmensangaben in der Textgenerierung innerhalb von Bildern. Das Modell kann demnach lange Textpassagen am Stück korrekt darstellen. | Bild: Recraft

Der Benchmark basiert auf einem Bewertungssystem, bei dem Nutzer der Plattform Bildpaare verschiedener Modelle in einem Blindtest vergleichen. Zur Bewertung wird das aus dem Schach bekannte ELO-System verwendet.

Anzeige
Anzeige

Präzise Kontrolle für Designer

Recraft hebt besonders die Kontrollfunktionen des neuen Modells hervor. Designer können damit die exakte Position und Größe von Text in Bildern festlegen und mehrere Referenzbilder zur Definition eines Markenstils verwenden. Diese Anpassungen sind ohne erneutes Training des Modells möglich.

Beispielbild zeigt präzise Prompt-Umsetzung: Surreales Portrait mit schwebenden Elementen in Türkis und Orange.
Recraft V3 setzt laut eigenen Angaben neue Maßstäbe in der präzisen Umsetzung komplexer Prompts. Das Beispiel zeigt die detailgetreue Generierung selbst bei anspruchsvollen gestalterischen Vorgaben wie geometrischen Elementen und spezifischen Farbkombinationen. | Bild: Recraft

Das Unternehmen bietet auch Vektorgrafik-Generierung an - von einfachen Piktogrammen bis zu detaillierten Illustrationen. Zusätzlich stehen KI-basierte Bildbearbeitungsfunktionen wie Radiergummi, Inpainting und Hintergrundentfernung zur Verfügung.

Demonstration der Vektorgrafik-Qualität: Präzise gerenderte 3D-Grundformen in verschiedenen Farben und Anordnungen.
Laut Recraft kann v3 qualitativ hochwertige Vektorgrafiken rendern. | Bild: Recraft

Der Web-Zugang ist mit 50 kostenlosen Credits täglich nutzbar, der Basisplan mit 1000 Credits kostet zehn Euro pro Monat. Für Entwickler und Unternehmen bietet Recraft eine API an.

Marktführer bereiten Updates vor

KI-Bild-Interessierte warten derzeit auf das neue Modell v7 des Platzhirsches Midjourney. Das aktuelle Modell von Midjourney erzeugt zwar die wohl ästhetischsten Bilder aller Modelle (Recraft sagt, dass es ästhetischer ist als MJ), hinkt aber beim Prompt-Verständnis und bei Text in Bildern deutlich hinterher. Dafür ist der kürzlich vorgestellte Editor ein mächtiges Bildbearbeitungstool - auch für vorhandenes Bildmaterial.

Auch OpenAI-Chef Sam Altman stellte kürzlich bei einem OpenAI-Event in London ein Update für OpenAIs mittlerweile veralteten DALL-E 3 in Aussicht. Bekannt ist, dass das neue multimodale GPT-4o bereits Bildgenerierungsfähigkeiten hat, die DALL-E 3 übertreffen, die bislang aber nicht freigeschaltet wurden. Womöglich wartet OpenAI die US-Wahlen ab.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Recraft, ein KI-Startup, hat mit Recraft V3 ein neues Bildgenerierungsmodell vorgestellt, das im Hugging Face Benchmark für Text-zu-Bild-Modelle mit einem ELO-Wert von 1172 den ersten Platz belegt und damit die neuesten Modelle Flux und Ideogram übertrifft.
  • Das Modell zeichnet sich laut Recraft durch präzise Kontrolle über die Bildgenerierung aus, ermöglicht die Festlegung von Position und Größe des Textes in Bildern, unterstützt die Kombination von Bildern mit Text und bietet die Möglichkeit, einen Markenstil durch Referenzbilder zu definieren und iterativ anzupassen, ohne das Modell neu trainieren zu müssen.
  • Recraft V3 unterstützt auch die Generierung von Vektorgrafiken, bietet verschiedene KI-basierte Bildbearbeitungsfunktionen und stellt eine API für Entwickler und Unternehmen bereit.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!