Black Forest Labs führt eine API ein, die es ermöglicht, das KI-Bildmodell FLUX Pro mit nur fünf Beispielbildern an spezifische Marken und Stile anzupassen.
Die Finetuning-API soll eine zentrale Schwachstelle aktueller Bildmodelle beheben: die mangelnde Präzision bei der Generierung spezifischer visueller Stile und Markenidentitäten.
Laut Black Forest Labs behält das Modell beim Finetuning seine Vielseitigkeit, kann aber das gelernte Wissen über benutzerdefinierte Inhalte in neue Bildkompositionen einfließen lassen. Das System kann Bilder mit einer Auflösung von bis zu vier Megapixeln erzeugen.
Die angepassten Modelle können mit dem bestehenden FLUX-Ökosystem verwendet werden, einschließlich den Modellen FLUX.1 Pro, FLUX1.1 Pro Ultra und FLUX-Werkzeugen wie FLUX.1 Fill für Inpainting und FLUX.1 Depth für strukturelle Bildkontrolle.
Eine erste praktische Anwendung findet die Technologie beim BurdaVerlag. Der Medienkonzern nutzt die Flux-Finetuning-API, um für verschiedene Marken eigene Versionen des Bildmodells zu entwickeln. Bei der Kindermarke Lissy PONY sollen Kreativteams in Minutenschnelle markenspezifische Bilder generieren können, die die charakteristischen visuellen Elemente der Marke bewahren.
Technische Details und Empfehlungen
Das System akzeptiert zwischen 1 und 20 Trainingsbilder in gängigen Formaten wie JPG, PNG und WebP. Die Auflösung der Trainingsbilder wird bei einem Megapixel gekappt. Für optimale Ergebnisse empfiehlt Black Forest Labs mindestens fünf hochwertige Bilder mit klar erkennbaren Motiven.
Entwickler können verschiedene Parameter für das Training anpassen. Dazu gehören der Trainingsmodus ("character", "product", "style" oder "general"), die Anzahl der Trainingsiterationen (mindestens 100, Standard: 300) und die Lernrate. Außerdem kann man zwischen schnellem Training und Inferenz oder höherer Qualität wählen.
Für optimale Ergebnisse empfiehlt das Unternehmen verschiedene empfohlene Vorgehensweisen: Beim Training von Charakteren etwa sollten die Beispielbilder jeweils nur eine einzelne Figur zeigen. Bei der Übertragung von Stilen empfiehlt das Unternehmen, mit höheren Finetuning-Stärken zu experimentieren, da diese oft zu besseren Ergebnissen führe.
Weitere technische Details und Anleitungen zur optimalen Nutzung der API stellt Black Forest Labs in einem Finetuning-Guide zur Verfügung.
Die FLUX Pro Finetuning API befindet sich, wie die gesamte API, derzeit in der Beta-Phase. Für die Nutzung wird ein API-Key benötigt. Black Forest Labs macht in der Ankündigung keine Angaben zur allgemeinen Verfügbarkeit.