Das KI-Start-up Black Forest Labs, gegründet von ehemaligen Entwicklern von Stability.ai, will hochmoderne generative KI-Modelle für Bild und Video entwickeln. Mit Flux.1 gibt es bereits einen ersten Vorgeschmack.
Ein Team ehemaliger Entwickler des bekannten Open-Source-Bildgenerators Stable Diffusion hat ein neues KI-Start-up gegründet: Black Forest Labs mit Sitz in Deutschland, Freiburg. Das Unternehmen will nach eigenen Angaben "hochmoderne generative Deep-Learning-Modelle für Medien wie Bilder und Videos entwickeln und voranbringen".
Das Team besteht aus KI-Forschern und -Entwicklern, die zuvor bei Stability.ai an Stable Diffusion und anderen generativen KI-Modellen gearbeitet haben und Stability.ai im Frühjahr verlassen haben.
Zu ihren Innovationen gehören unter anderem VQGAN, Latent Diffusion, Stable Diffusion XL, Stable Video Diffusion, Rectified Flow Transformers und Adversarial Diffusion Distillation für die Bildsynthese in Echtzeit.
Black Forest Labs hat in einer Seed-Finanzierungsrunde 31 Millionen Dollar eingesammelt. Die Runde wurde von Andreessen Horowitz angeführt, mit namhaften Beteiligungen von Angel-Investoren wie Brendan Iribe, Michael Ovitz, Garry Tan, Timo Aila und Vladlen Koltun. Auch General Catalyst und MätchVC haben investiert.
Flux "Pro" soll neuen Standard bei generativer Bild-KI setzen
Zum Start veröffentlicht Black Forest Labs die Flux.1-Suite von Text-zu-Bild-Modellen, die laut dem Unternehmen "einen neuen Stand der Technik bei Bilddetails, Prompt-Befolgung, Stilvielfalt und Szenenkomplexität für die Text-zu-Bild-Synthese" definieren. Alle Flux.1-Modellvarianten unterstützen eine Vielzahl von Seitenverhältnissen und Auflösungen in 0,1 und 2,0 Megapixeln.
Laut Black Forest Labs übertreffen Flux.1 [pro] und [dev] beliebte Modelle wie Midjourney v6.0, DALL-E 3 (HD) und SD3-Ultra in Bezug auf visuelle Qualität, Prompt-Befolgung, Größen-/Aspektvariabilität, Typografie und Ausgabevielfalt. Flux.1 [schnell] sei das fortschrittlichste schnelle Modell und übertreffe Konkurrenten in der gleichen Klasse und starke nicht-destillierte Modelle wie Midjourney.
Flux.1 gibt es in drei Varianten: Flux.1 [pro] für die kommerzielle Nutzung via Replicate und fal.ai, Flux.1 [dev] für nicht-kommerzielle Anwendungen und Flux.1 [schnell] für die lokale Entwicklung und den persönlichen Gebrauch. Letzteres ist das schnellste Modell und unter einer Apache-2.0-Lizenz frei verfügbar.
Als nächsten Schritt plant Black Forest Labs die Veröffentlichung von Text-zu-Video-Modellen, die "präzise Erstellung und Bearbeitung in hoher Auflösung und mit beispielloser Geschwindigkeit" ermöglichen sollen. Das Unternehmen sucht derzeit KI- und Backend-Ingenieure, um sein Team weiter auszubauen.
Als Nächstes plant Black Forest Labs die Veröffentlichung von Text-zu-Video-Modellen, die "präzise Erstellung und Bearbeitung in hoher Auflösung und mit beispielloser Geschwindigkeit" ermöglichen sollen. Das Unternehmen sucht derzeit KI- und Backend-Ingenieure.