Inhalt
summary Zusammenfassung

Menschen, Objekte, Landschaften - was auch immer das Motiv ist, ein neuer Algorithmus von Stable Diffusion kann Variationen erzeugen, ohne das Original zu kopieren.

Mit "Reimagine" hat Stability AI sein generatives KI-Bildmodell um eine neue Funktion erweitert. Vorerst handelt es sich nur um ein neues Tool in der Web-Toolbox Clipdrop, die Stability AI Anfang des Monats übernommen hat. Bald soll die Funktion auch dem Open-Source-Modell hinzugefügt werden. Mit Reimagine können Nutzer:innen schnell mehrere Variationen eines einzigen Bildes erstellen.

Komplexe Prompts sind nach Angaben des Studios nicht nötig. Stattdessen lädt man mit Clipdrop das gewünschte Bild über das Webinterface hoch und generiert dann beliebig viele Variationen. Leider ist es nicht möglich, das Modell über Text mit weiterem Kontext zu versehen.

Als Beispiel zeigt Stability AI ein Schlafzimmer: Das Bild oben links ist das Original, die anderen drei sind von Stable Diffusion neu erfundene Variationen. Ähnliches wäre z.B. für modische Kleidungslooks oder Frisuren denkbar.

Anzeige
Anzeige
Vier Bilder eines Schlafzimmers im Quadrat angeordnet. Links oben befindet sich das Originalbild, bei den restlichen handelt es sich um KI-Variationen.
Bild: Stability AI

Filter für unangemessene Inhalte

Stability AI betont, dass die neuen Bilder nur vom Original inspiriert sind. Dies habe jedoch seine Grenzen und funktioniere bei einigen Szenen besser, bei anderen schlechter.

Ein eingebauter Filter soll unangemessene Anfragen blockieren, kann aber manchmal auch unter- oder überregulieren. "Das Modell kann auch abnormale Ergebnisse liefern oder manchmal ein verzerrtes Verhalten zeigen", warnen die Entwickler:innen im Blogpost.

Bild wird komplett enkodiert

Bei Reimagine wurde der ursprüngliche Text-Encoder von Stable Diffusion durch einen Bild-Encoder ersetzt, erklärt Stability sehr kurz die zugrundeliegende Technik. Im Gegensatz zum bekannten Image-to-Image-Algorithmus sollen keine Pixel des Originals verwendet werden. Eine wissenschaftliche Arbeit zur weiteren Erläuterung fehlt.

Der Download der mit Reimagine generierten Bilder ist in einer maximalen Auflösung von 768 x 768 Pixel möglich, die kostenpflichtige Pro-Mitgliedschaft bei Clipdrop (ab 9 Euro/Monat) bietet jedoch Zugriff auf einen Upscaler. Reimagine soll demnächst auch als Open Source über Stabilitys GitHub verfügbar sein.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Stability AI hat "Reimagine" entwickelt, einen Stable-Diffusion-Algorithmus, der Variationen von Bildern erzeugt, ohne das Original zu kopieren.
  • Reimagine ist derzeit nur über eine Webschnittstelle verfügbar, soll aber bald als Open Source verfügbar sein.
  • Anstelle eines Text-Encoders verwendet Reimagine einen Bild-Encoder.
Quellen
Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!