Inhalt
summary Zusammenfassung

Das neue Text-zu-Bild-Modell "F Lite" von Freepik wurde ausschließlich mit urheberrechtlich unbedenklichem Material trainiert. Es soll als rechtssicheres Forschungsmodell dienen und eine Alternative zu rechtlich umstrittenen Generatoren wie Midjourney sein.

Anzeige

Freepik hat ein neues generatives KI-Modell namens F Lite vorgestellt, das mit rund 10 Milliarden Parametern aufwartet und ausschließlich mit kommerziell lizenzierten Bildern aus dem eigenen Bestand trainiert wurde. Laut Freepik handelt es sich um das erste öffentlich verfügbare Modell dieser Größenordnung, das vollständig auf "safe-for-work"-Inhalte zurückgreift.

Entwickelt wurde es gemeinsam mit dem KI-Startup Fal.ai. Das Training erfolgte auf 64 Nvidia H100 GPUs über einen Zeitraum von zwei Monaten, basierend auf einem internen Datensatz von etwa 80 Millionen Bildern.

F Lite ergänzt eine wachsende Zahl von Bildgeneratoren, die auf rechtlich abgesicherte Daten setzen – darunter Adobe, Getty Images und Shutterstock. Hintergrund ist eine Vielzahl von Urheberrechtsklagen gegen Anbieter wie OpenAI oder Midjourney, die häufig auf Daten aus dem offenen Internet zurückgreifen.

Anzeige
Anzeige

Freepik positioniert F Lite allerdings als offene Alternative, die Entwickler zur Weiterentwicklung nutzen können. Das Modell ist auf GitHub verfügbar, benötigt aber eine GPU mit mindestens 24 GB VRAM. Eine Demo kann man hier testen.

Nachtraining mit menschlichem Feedback verbessert Bildqualität

Laut Freepik erzeugt F Lite besonders überzeugende Illustrationen und vektorartige Kompositionen – ein Effekt, der vermutlich auf die Datengrundlage aus dem Freepik-Katalog zurückgeht.

Bei fotorealistischen Bildern zeigen sich hingegen Schwächen: feine Texturen wie Haut oder Stoffe fehlen oft, anatomisch komplexe Szenen führen zu sichtbaren Fehlern. Auch mit kurzen Prompts hat das Modell Schwierigkeiten – es wurde primär auf längere, beschreibende Texte trainiert. Die Fähigkeit, präzisen Text in Bildern darzustellen, ist derzeit noch eingeschränkt.

Die Freepik-Interpretation des Foto-Prompts "DLSR photograph, a red-bearded guy dancing in the rain" erinnert an frühere KI-Zeiten. | Bild: F Lite prompted by THE DECODER
Der gleiche Prompt führt bei Midjourney zu einem kunstvollen, fotorealistischen Bild, das so gar nicht mehr an KI erinnert. | Bild: Midjourney prompted by THE DECODER

Freepik sieht die Ursache in der begrenzten Datenmenge und Rechenzeit. Die Autoren verweisen auf bestehende Skalierungsgesetze bei Diffusionsmodellen, wonach Qualität und Detailtreue mit größerem Datensatz und längerer Trainingsdauer deutlich steigen.

Freepik als Anbieter von Stockmedien und KI-Werkzeugen

Freepik ist ein in Spanien ansässiges Unternehmen, das sich auf die Bereitstellung von lizenzierter digitaler Grafik für Designer, Unternehmen und Kreativschaffende spezialisiert hat. Die Plattform bietet eine breite Palette an Stockmedien, darunter Vektorgrafiken, Fotos, Illustrationen, Icons und Vorlagen für Präsentationen. Neben kostenpflichtigen Abonnements stellt Freepik auch einen Teil seines Angebots kostenlos zur Verfügung.

Empfehlung

In den vergangenen Jahren hat Freepik zunehmend in KI-basierte Werkzeuge investiert, etwa für automatische Bildbearbeitung, Content-Erstellung und jetzt auch für die Generierung synthetischer Bilder.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Freepik hat mit F Lite ein neues Text-zu-Bild-Modell vorgestellt, das mit etwa 10 Milliarden Parametern ausschließlich auf kommerziell lizenzierten Bildern aus dem eigenen Bestand trainiert wurde und als rechtssichere Alternative zu Modellen wie Midjourney positioniert ist.
  • Das Modell zeigt seine Stärken bei Illustrationen und vektorbasierten Kompositionen, hat aber Schwächen bei fotorealistischen Bildern und kurzen Prompts; Freepik führt diese Einschränkungen auf die begrenzte Datenmenge und Trainingszeit zurück.
  • F Lite steht als Open-Source-Modell auf GitHub zur Verfügung und richtet sich an Entwickler, die auf einer rechtlich abgesicherten Datenbasis weiterarbeiten möchten; für die Nutzung ist eine GPU mit mindestens 24 GB VRAM erforderlich.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!