Anzeige
Skip to content

Black Forest Labs kombiniert mit FLUX.1 Text-zu-Bild und Bildbearbeitung in einem Modell

Image description
Flux.1 pro prompted by THE DECODER

Mit FLUX.1 Kontext erweitert Black Forest Labs Text-zu-Bild-Modelle um eine Kombination aus Bildbearbeitung und Generierung. Die Modelle ermöglichen schnelle, kontextbezogene Bildmanipulationen auf Basis von Text- und Bildvorgaben inklusive konsistenter Stil- und Charaktererhaltung.

Im Unterschied zu bisherigen Modellen erlaubt FLUX.1 Kontext die gleichzeitige Verwendung von Text und Bildern als Prompt. Nutzer können damit bestehende Bilder bearbeiten, neue Szenen im Stil eines Referenzbildes erzeugen oder Charaktere konsistent über mehrere Bildgenerationen hinweg darstellen.

Zu den zentralen Funktionen gehören lokale Bildbearbeitung, bei denen gezielt einzelne Bildelemente verändert werden, ohne das restliche Bild zu beeinflussen. Stilreferenzen können über Textanweisungen mitgegeben werden, um neue Szenen im Stil eines Ausgangsbildes zu erzeugen.

Ein Modell für Bearbeitung, Generierung und Stilübertragung

Das Modell FLUX.1 Kontext [pro] kombiniert klassische Text-zu-Bild-Generierung mit der Möglichkeit, bestehende Bilder schrittweise zu bearbeiten. Es verarbeitet sowohl Text- als auch Bildprompts und soll laut Black Forest Labs bis zu zehnmal schneller arbeiten als aktuelle Vergleichsmodelle. Dabei soll die Konsistenz von Charakteren, Stilen und Objekten über mehrere Bearbeitungsschritte hinweg erhalten bleiben - das gelingt gängigen Bild-Tools wie GPT-Image-1 oder Midjourney nicht verlässlich.

Anzeige
DEC_D_Incontent-1

Bildsequenz: KI-generierter Vogel mit VR-Brille (FLUX.1) in verschiedenen Szenen (Bar, Kino, Supermarkt), zeigt Charakterkonsistenz.
Die mit FLUX.1 generierte Bildsequenz demonstriert die Fähigkeit des KI-Modells, Charakterkonsistenz über komplexe, per Textprompt variierte Szenen hinweg zu wahren. So bleibt der Vogel mit VR-Brille in der Bar, im Kino oder beim Einkaufen stets wiedererkennbar. | Bild: BFL

Das experimentelle Modell FLUX.1 Kontext [max] richtet sich an Nutzer mit höheren Anforderungen an typografische Präzision, konsistente Bearbeitungen und schnelle Inferenzzeiten. Ziel ist es, bei maximaler Leistung eine hohe Prompt-Treue zu gewährleisten.

Zur Leistungsbewertung führte Black Forest Labs eigene Tests mit dem hausinternen Benchmark "KontextBench" durch. FLUX.1 Kontext [pro] erreichte dabei laut Unternehmen durchgehend Spitzenwerte, insbesondere in den Kategorien Textbearbeitung und Charaktererhalt. Auch bei Geschwindigkeit und Prompt-Treue übertraf das Modell andere aktuelle Ansätze.

Balkendiagramme: Leistung von KI-Bildbearbeitungsmodellen (FLUX.1, GPT-Image-1, Gemini etc.) bei versch. Bearbeitungsaufgaben.
Flux.1 Kontext soll auch OpenAIs ChatGPT-Modell GPT-Image-1 übertreffen. | Bild: BFL

Gleichzeitig weist das Modell Schwächen auf: In längeren Bearbeitungsketten kann es zu sichtbaren Artefakten kommen, gelegentlich werden Prompts nicht korrekt umgesetzt. Außerdem ist das Weltwissen des Modells begrenzt, was sich negativ auf kontextuell genaue Inhalte auswirken kann.

Offene Version für Forschung und neue Schnittstellen für Tests

Für Forschungszwecke stellt BFL eine kleinere Variante namens FLUX.1 Kontext [dev] bereit. Das Modell mit 12 Milliarden Parametern soll für Sicherheitstests und Anpassungen genutzt werden können und wird in einer privaten Beta verfügbar gemacht. Nach der öffentlichen Freigabe soll es über Partner wie Hugging Face verbreitet werden.

Anzeige
DEC_D_Incontent-2

Zur Vereinfachung der Nutzung hat BFL zudem den "FLUX Playground" freigeschaltet. Die webbasierte Oberfläche erlaubt das Testen der Modelle ohne technische Integration. Ziel ist es, Anwendungsfälle zu validieren und Funktionen in Echtzeit zu demonstrieren.

Die FLUX.1 Kontext Modelle sind unter anderem über Plattformen wie KreaAI, Freepik, Lightricks, OpenArt und LeonardoAI sowie Infrastrukturpartner wie FAL, Replicate und DataCrunch verfügbar.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: BFL Blog

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren