Inhalt
summary Zusammenfassung

Black Forest Labs führt eine API ein, die es ermöglicht, das KI-Bildmodell FLUX Pro mit nur fünf Beispielbildern an spezifische Marken und Stile anzupassen.

Anzeige

Die Finetuning-API soll eine zentrale Schwachstelle aktueller Bildmodelle beheben: die mangelnde Präzision bei der Generierung spezifischer visueller Stile und Markenidentitäten.

Laut Black Forest Labs behält das Modell beim Finetuning seine Vielseitigkeit, kann aber das gelernte Wissen über benutzerdefinierte Inhalte in neue Bildkompositionen einfließen lassen. Das System kann Bilder mit einer Auflösung von bis zu vier Megapixeln erzeugen.

Die angepassten Modelle können mit dem bestehenden FLUX-Ökosystem verwendet werden, einschließlich den Modellen FLUX.1 Pro, FLUX1.1 Pro Ultra und FLUX-Werkzeugen wie FLUX.1 Fill für Inpainting und FLUX.1 Depth für strukturelle Bildkontrolle.

Anzeige
Anzeige
Vier KI-generierte Illustrationen eines Einhorns im Lissy PONY Markenstil: Als Straßenkunst, in Fantasiewelt, mit Roboter und auf Meereswelle.
Der Burda-Verlag kann für seine Kindermarke Lissy PONY dank Feintuning in Sekundenschnelle verschiedene Bildvariationen erstellen. | Bild: via Black Forest Labs

Eine erste praktische Anwendung findet die Technologie beim BurdaVerlag. Der Medienkonzern nutzt die Flux-Finetuning-API, um für verschiedene Marken eigene Versionen des Bildmodells zu entwickeln. Bei der Kindermarke Lissy PONY sollen Kreativteams in Minutenschnelle markenspezifische Bilder generieren können, die die charakteristischen visuellen Elemente der Marke bewahren.

Technische Details und Empfehlungen

Das System akzeptiert zwischen 1 und 20 Trainingsbilder in gängigen Formaten wie JPG, PNG und WebP. Die Auflösung der Trainingsbilder wird bei einem Megapixel gekappt. Für optimale Ergebnisse empfiehlt Black Forest Labs mindestens fünf hochwertige Bilder mit klar erkennbaren Motiven.

Entwickler können verschiedene Parameter für das Training anpassen. Dazu gehören der Trainingsmodus ("character", "product", "style" oder "general"), die Anzahl der Trainingsiterationen (mindestens 100, Standard: 300) und die Lernrate. Außerdem kann man zwischen schnellem Training und Inferenz oder höherer Qualität wählen.

Für optimale Ergebnisse empfiehlt das Unternehmen verschiedene empfohlene Vorgehensweisen: Beim Training von Charakteren etwa sollten die Beispielbilder jeweils nur eine einzelne Figur zeigen. Bei der Übertragung von Stilen empfiehlt das Unternehmen, mit höheren Finetuning-Stärken zu experimentieren, da diese oft zu besseren Ergebnissen führe.

Weitere technische Details und Anleitungen zur optimalen Nutzung der API stellt Black Forest Labs in einem Finetuning-Guide zur Verfügung.

Empfehlung

Die FLUX Pro Finetuning API befindet sich, wie die gesamte API, derzeit in der Beta-Phase. Für die Nutzung wird ein API-Key benötigt. Black Forest Labs macht in der Ankündigung keine Angaben zur allgemeinen Verfügbarkeit.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Black Forest Labs stellt eine API vor, mit der das KI-Bildmodell FLUX Pro mit nur fünf Beispielbildern an spezifische Marken und Stile angepasst werden kann, um eine zentrale Schwachstelle aktueller Bildmodelle zu beheben: die mangelnde Präzision bei der Generierung spezifischer visueller Stile und Markenidentitäten.
  • Laut Black Forest Labs behält das Modell beim Finetuning seine Vielseitigkeit, kann aber das gelernte Wissen über benutzerdefinierte Inhalte in neue Bildkompositionen einfließen lassen.
  • Der Burda Verlag nutzt die API, um für verschiedene Marken eigene Versionen des Bildmodells zu entwickeln. Für die Kindermarke Lissy PONY sollen Kreativteams damit in wenigen Minuten markenspezifische Bilder generieren können.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!