Skip to content

Eigenes Bildmodell mit fünf Beispielen: Flux bekommt eine Finetuning-API

Image description
Black Forest Labs

Kurz & Knapp

  • Black Forest Labs stellt eine API vor, mit der das KI-Bildmodell FLUX Pro mit nur fünf Beispielbildern an spezifische Marken und Stile angepasst werden kann, um eine zentrale Schwachstelle aktueller Bildmodelle zu beheben: die mangelnde Präzision bei der Generierung spezifischer visueller Stile und Markenidentitäten.
  • Laut Black Forest Labs behält das Modell beim Finetuning seine Vielseitigkeit, kann aber das gelernte Wissen über benutzerdefinierte Inhalte in neue Bildkompositionen einfließen lassen.
  • Der Burda Verlag nutzt die API, um für verschiedene Marken eigene Versionen des Bildmodells zu entwickeln. Für die Kindermarke Lissy PONY sollen Kreativteams damit in wenigen Minuten markenspezifische Bilder generieren können.

Black Forest Labs führt eine API ein, die es ermöglicht, das KI-Bildmodell FLUX Pro mit nur fünf Beispielbildern an spezifische Marken und Stile anzupassen.

Die Finetuning-API soll eine zentrale Schwachstelle aktueller Bildmodelle beheben: die mangelnde Präzision bei der Generierung spezifischer visueller Stile und Markenidentitäten.

Laut Black Forest Labs behält das Modell beim Finetuning seine Vielseitigkeit, kann aber das gelernte Wissen über benutzerdefinierte Inhalte in neue Bildkompositionen einfließen lassen. Das System kann Bilder mit einer Auflösung von bis zu vier Megapixeln erzeugen.

Die angepassten Modelle können mit dem bestehenden FLUX-Ökosystem verwendet werden, einschließlich den Modellen FLUX.1 Pro, FLUX1.1 Pro Ultra und FLUX-Werkzeugen wie FLUX.1 Fill für Inpainting und FLUX.1 Depth für strukturelle Bildkontrolle.

Vier KI-generierte Illustrationen eines Einhorns im Lissy PONY Markenstil: Als Straßenkunst, in Fantasiewelt, mit Roboter und auf Meereswelle.
Der Burda-Verlag kann für seine Kindermarke Lissy PONY dank Feintuning in Sekundenschnelle verschiedene Bildvariationen erstellen. | Bild: via Black Forest Labs

Eine erste praktische Anwendung findet die Technologie beim BurdaVerlag. Der Medienkonzern nutzt die Flux-Finetuning-API, um für verschiedene Marken eigene Versionen des Bildmodells zu entwickeln. Bei der Kindermarke Lissy PONY sollen Kreativteams in Minutenschnelle markenspezifische Bilder generieren können, die die charakteristischen visuellen Elemente der Marke bewahren.

Technische Details und Empfehlungen

Das System akzeptiert zwischen 1 und 20 Trainingsbilder in gängigen Formaten wie JPG, PNG und WebP. Die Auflösung der Trainingsbilder wird bei einem Megapixel gekappt. Für optimale Ergebnisse empfiehlt Black Forest Labs mindestens fünf hochwertige Bilder mit klar erkennbaren Motiven.

Entwickler können verschiedene Parameter für das Training anpassen. Dazu gehören der Trainingsmodus ("character", "product", "style" oder "general"), die Anzahl der Trainingsiterationen (mindestens 100, Standard: 300) und die Lernrate. Außerdem kann man zwischen schnellem Training und Inferenz oder höherer Qualität wählen.

Für optimale Ergebnisse empfiehlt das Unternehmen verschiedene empfohlene Vorgehensweisen: Beim Training von Charakteren etwa sollten die Beispielbilder jeweils nur eine einzelne Figur zeigen. Bei der Übertragung von Stilen empfiehlt das Unternehmen, mit höheren Finetuning-Stärken zu experimentieren, da diese oft zu besseren Ergebnissen führe.

Weitere technische Details und Anleitungen zur optimalen Nutzung der API stellt Black Forest Labs in einem Finetuning-Guide zur Verfügung.

Die FLUX Pro Finetuning API befindet sich, wie die gesamte API, derzeit in der Beta-Phase. Für die Nutzung wird ein API-Key benötigt. Black Forest Labs macht in der Ankündigung keine Angaben zur allgemeinen Verfügbarkeit.

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren