Recraft v3: Es gibt einen neuen Bewerber um das beste KI-Bildmodell

31. Oktober 2024

Recraft

Nachdem zuletzt Ideogram und Flux Geschwindigkeit und Genauigkeit bei KI-Bildern verbessert haben, gibt es jetzt einen neuen Benchmark: Recraft V3.

Das KI-Startup Recraft hat ein neues Bildgenerierungsmodell vorgestellt, das nach eigenen Angaben neue Maßstäbe in der KI-Bildgenerierung setzt. Für diese Aussage gibt es auch einen unabhängigen Beleg: Recraft V3 belegt im Hugging Face Benchmark für Text-zu-Bild-Modelle mit einem ELO-Wert von 1172 den ersten Platz vor den neuesten Modellen Flux und Ideogram.

Laut Recraft ist das eigene neueste Modell am besten bei der Generierung von Text in Bildern, der anatomischen Genauigkeit, dem Verständnis von Prompts und der ästhetischen Qualität. Das Modell soll zudem lange Texte am Stück korrekt rendern können, aktuellen Modellen gelingt das nur bei wenigen Worten.

Werbebanner für Recraft V3 mit türkisfarbener Schrift auf orangem Hintergrund, beschreibt Textgenerierungsfähigkeiten. — Eine besondere Stärke von Recraft V3 liegt nach Unternehmensangaben in der Textgenerierung innerhalb von Bildern. Das Modell kann demnach lange Textpassagen am Stück korrekt darstellen. | Bild: Recraft

Der Benchmark basiert auf einem Bewertungssystem, bei dem Nutzer der Plattform Bildpaare verschiedener Modelle in einem Blindtest vergleichen. Zur Bewertung wird das aus dem Schach bekannte ELO-System verwendet.

Präzise Kontrolle für Designer

Recraft hebt besonders die Kontrollfunktionen des neuen Modells hervor. Designer können damit die exakte Position und Größe von Text in Bildern festlegen und mehrere Referenzbilder zur Definition eines Markenstils verwenden. Diese Anpassungen sind ohne erneutes Training des Modells möglich.

Beispielbild zeigt präzise Prompt-Umsetzung: Surreales Portrait mit schwebenden Elementen in Türkis und Orange. — Recraft V3 setzt laut eigenen Angaben neue Maßstäbe in der präzisen Umsetzung komplexer Prompts. Das Beispiel zeigt die detailgetreue Generierung selbst bei anspruchsvollen gestalterischen Vorgaben wie geometrischen Elementen und spezifischen Farbkombinationen. | Bild: Recraft

Das Unternehmen bietet auch Vektorgrafik-Generierung an - von einfachen Piktogrammen bis zu detaillierten Illustrationen. Zusätzlich stehen KI-basierte Bildbearbeitungsfunktionen wie Radiergummi, Inpainting und Hintergrundentfernung zur Verfügung.

Demonstration der Vektorgrafik-Qualität: Präzise gerenderte 3D-Grundformen in verschiedenen Farben und Anordnungen. — Laut Recraft kann v3 qualitativ hochwertige Vektorgrafiken rendern. | Bild: Recraft

Der Web-Zugang ist mit 50 kostenlosen Credits täglich nutzbar, der Basisplan mit 1000 Credits kostet zehn Euro pro Monat. Für Entwickler und Unternehmen bietet Recraft eine API an.

Marktführer bereiten Updates vor

KI-Bild-Interessierte warten derzeit auf das neue Modell v7 des Platzhirsches Midjourney. Das aktuelle Modell von Midjourney erzeugt zwar die wohl ästhetischsten Bilder aller Modelle (Recraft sagt, dass es ästhetischer ist als MJ), hinkt aber beim Prompt-Verständnis und bei Text in Bildern deutlich hinterher. Dafür ist der kürzlich vorgestellte Editor ein mächtiges Bildbearbeitungstool - auch für vorhandenes Bildmaterial.

Auch OpenAI-Chef Sam Altman stellte kürzlich bei einem OpenAI-Event in London ein Update für OpenAIs mittlerweile veralteten DALL-E 3 in Aussicht. Bekannt ist, dass das neue multimodale GPT-4o bereits Bildgenerierungsfähigkeiten hat, die DALL-E 3 übertreffen, die bislang aber nicht freigeschaltet wurden. Womöglich wartet OpenAI die US-Wahlen ab.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: Recraft

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Recraft v3: Es gibt einen neuen Bewerber um das beste KI-Bildmodell

Präzise Kontrolle für Designer

Marktführer bereiten Updates vor

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.