Mit FLUX.1 Kontext erweitert Black Forest Labs Text-zu-Bild-Modelle um eine Kombination aus Bildbearbeitung und Generierung. Die Modelle ermöglichen schnelle, kontextbezogene Bildmanipulationen auf Basis von Text- und Bildvorgaben inklusive konsistenter Stil- und Charaktererhaltung.
Im Unterschied zu bisherigen Modellen erlaubt FLUX.1 Kontext die gleichzeitige Verwendung von Text und Bildern als Prompt. Nutzer können damit bestehende Bilder bearbeiten, neue Szenen im Stil eines Referenzbildes erzeugen oder Charaktere konsistent über mehrere Bildgenerationen hinweg darstellen.
Zu den zentralen Funktionen gehören lokale Bildbearbeitung, bei denen gezielt einzelne Bildelemente verändert werden, ohne das restliche Bild zu beeinflussen. Stilreferenzen können über Textanweisungen mitgegeben werden, um neue Szenen im Stil eines Ausgangsbildes zu erzeugen.
Ein Modell für Bearbeitung, Generierung und Stilübertragung
Das Modell FLUX.1 Kontext [pro] kombiniert klassische Text-zu-Bild-Generierung mit der Möglichkeit, bestehende Bilder schrittweise zu bearbeiten. Es verarbeitet sowohl Text- als auch Bildprompts und soll laut Black Forest Labs bis zu zehnmal schneller arbeiten als aktuelle Vergleichsmodelle. Dabei soll die Konsistenz von Charakteren, Stilen und Objekten über mehrere Bearbeitungsschritte hinweg erhalten bleiben - das gelingt gängigen Bild-Tools wie GPT-Image-1 oder Midjourney nicht verlässlich.

Das experimentelle Modell FLUX.1 Kontext [max] richtet sich an Nutzer mit höheren Anforderungen an typografische Präzision, konsistente Bearbeitungen und schnelle Inferenzzeiten. Ziel ist es, bei maximaler Leistung eine hohe Prompt-Treue zu gewährleisten.
Zur Leistungsbewertung führte Black Forest Labs eigene Tests mit dem hausinternen Benchmark "KontextBench" durch. FLUX.1 Kontext [pro] erreichte dabei laut Unternehmen durchgehend Spitzenwerte, insbesondere in den Kategorien Textbearbeitung und Charaktererhalt. Auch bei Geschwindigkeit und Prompt-Treue übertraf das Modell andere aktuelle Ansätze.

Gleichzeitig weist das Modell Schwächen auf: In längeren Bearbeitungsketten kann es zu sichtbaren Artefakten kommen, gelegentlich werden Prompts nicht korrekt umgesetzt. Außerdem ist das Weltwissen des Modells begrenzt, was sich negativ auf kontextuell genaue Inhalte auswirken kann.
Offene Version für Forschung und neue Schnittstellen für Tests
Für Forschungszwecke stellt BFL eine kleinere Variante namens FLUX.1 Kontext [dev] bereit. Das Modell mit 12 Milliarden Parametern soll für Sicherheitstests und Anpassungen genutzt werden können und wird in einer privaten Beta verfügbar gemacht. Nach der öffentlichen Freigabe soll es über Partner wie Hugging Face verbreitet werden.
Zur Vereinfachung der Nutzung hat BFL zudem den "FLUX Playground" freigeschaltet. Die webbasierte Oberfläche erlaubt das Testen der Modelle ohne technische Integration. Ziel ist es, Anwendungsfälle zu validieren und Funktionen in Echtzeit zu demonstrieren.
Die FLUX.1 Kontext Modelle sind unter anderem über Plattformen wie KreaAI, Freepik, Lightricks, OpenArt und LeonardoAI sowie Infrastrukturpartner wie FAL, Replicate und DataCrunch verfügbar.