Stability AI bringt sein neuestes Bildmodell SDXL 0.9 auf den Markt, das im Vergleich zum Vorgängermodell deutlich verbesserte Bild- und Kompositionsdetails erzeugt. Das Unternehmen wirbt damit, dass diese Verbesserung groß genug ist, um praktische Anwendungen für KI-generierte Bilder in verschiedenen Bereichen zu ermöglichen.
Mit der Veröffentlichung von SDXL 0.9 macht Stability AI einen "Sprung nach vorn" bei der Erzeugung hyperrealistischer Bilder für verschiedene kreative und industrielle Anwendungen. Im Vergleich zur Vorgängerversion zeichne sich die neue Version durch deutlich verbesserte Bild- und Kompositionsdetails aus, teilt das Unternehmen mit.
Der Zugriff ist ab sofort über ClipDrop möglich, die API wird in Kürze verfügbar sein. Ein offenes Release von Research Weights ist für Mitte Juli geplant, wenn das Modell auf die Version 1.0 zusteuert.
SDXL 0.9 bietet eine breite Palette kreativer Anwendungen für generative KI-Bilder, darunter hyperrealistische Kreationen für Film, Fernsehen, Musik, Schulungsvideos, Design und industrielle Anwendungen. Stability AI meint, dass diese Fähigkeiten sein neuestes Modell an die Spitze realer KI-Bildanwendungen bringen.
Funktionen jenseits der Bildgenerierung
SDXL 0.9 bietet zusätzlich zu den grundlegenden Text-Eingabefunktionen viele weitere Funktionen wie Picture-by-Picture (Eingabe eines Bildes, um Variationen zu erhalten), Inpainting (Rekonstruktion fehlender Teile in einem Bild) und Outpainting (nahtlose Erweiterung bestehender Bilder).
Die Kompositionsverbesserungen in SDXL 0.9 basieren auf einer deutlichen Erhöhung der Anzahl der Parameter im Vergleich zur vorherigen Beta-Version. Die Parameter stellen die Summe aller Gewichte und Verzerrungen in einem neuronalen Netz dar. Das neue Modell hat ein Basismodell mit 3,5B Parametern und eine "Ensemble-Pipeline" mit 6,6B Parametern. Im Vergleich dazu wurde in der Beta-Version nur ein Modell mit 3,1B Parametern verwendet.
Um realistischere Bilder mit größerer Tiefe und einer höheren Auflösung von 1024x1024 zu erzeugen, verwendet SDXL 0.9 zwei CLIP-Modelle, darunter das bisher größte OpenCLIP-Modell (OpenCLIP ViT-G/14).
Zugänglichkeit und Leistung auf Consumer-Hardware
Trotz seiner fortschrittlichen Funktionen und Modellarchitektur kann SDXL 0.9 auf modernen Grafikkarten ausgeführt werden. Die einzigen Voraussetzungen sind ein Windows 10 oder 11 oder Linux Betriebssystem, 16 GB RAM und eine Nvidia GeForce RTX 20 (äquivalent oder höher) Grafikkarte mit mindestens 8 GB VRAM. Linux-Nutzer können eine kompatible AMD-Karte mit 16 GB VRAM verwenden.
Seit dem Start der Beta-Version am 13. April hat SDXL mehr als 700.000 Bilder generiert und "großartige Reaktionen" von "fast 7.000" Discord-Nutzern erhalten. Auf der Plattform finden regelmäßig "Showdowns" statt, bei denen 54.000 Bilder eingereicht und 3.521 SDXL-Bilder zu Gewinnern erklärt wurden.
Verfügbarkeit und Zukunftspläne
SDXL 0.9 ist auf der ClipDrop-Plattform von Stability AI verfügbar. API- und DreamStudio-Benutzer haben ab dem 26. Juni Zugriff. Der Code zur Ausführung der Open-Source-Version wird später auf GitHub verfügbar sein. Die Open-Source-Veröffentlichung des vollständigen SDXL 1.0 Modells ist für Mitte Juli geplant.
Derzeit wird SDXL 0.9 unter einer nicht-kommerziellen, reinen Forschungslizenz veröffentlicht. Forscher können Zugang zu den Modellen beantragen.