Stable Diffusion 3: Künstler entfernen 80 Millionen Bilder aus Trainingsdaten

8. März 2023

Midjourney prompted by THE DECODER

80 Millionen Bilder verschwinden aus dem Trainingsmaterial für Stable Diffusion 3. Doch das Urheberrechtsproblem großer KI-Bildmodelle ist damit lange nicht gelöst.

Der Erfolg von KI-Bildmodellen hat eine Schattenseite: Von Beginn an begleitete die Entwicklung die Kritik an Unternehmen wie Stability AI, die ohne Zustimmung der Künstler:innen deren Werke zum Training von Stable Diffusion verwendet haben. Mittlerweile streiten sich die Beteiligten auch vor Gericht.

Das AI-Startup Spawning hat es sich zur Aufgabe gemacht, etwas mehr Transparenz in die Sache zu bringen. In einem ersten Schritt hat es die Suchmaschine haveibeentrained.com veröffentlicht, mit der man die Trainingsdaten durchsuchen kann. Das hat unter anderem dazu geführt, dass Nutzer:innen sensible Daten über sich im Datensatz entdeckt haben.

Zur Funktion der Plattform gehört auch, dass Künstler:innen ihre Bilder aus dem Trainingsdatensatz für KI-Modelle entfernen können. Im Dezember 2022 kündigte Spawning an, dass Stability AI dieses sogenannte Opt-out von Künstler:innen beim Training von Stable Diffusion 3 berücksichtigen werde. Die Frist ist am 3. März abgelaufen.

Nun gibt Spawning bekannt, dass Künstler:innen die Freigabe von 80 Millionen Kunstwerken zum Training von KI-Modellen entzogen haben. Spawning wertet das als Erfolg.

"Das ist ein wichtiger Präzedenzfall auf dem Weg zur Verwirklichung unserer Vision einer einvernehmlichen KI und wir stehen erst am Anfang!", so die Organisation auf Twitter.

Gemessen an den mehr als zwei Milliarden Bildern des von Stable Diffusion genutzten LAION-Datensatzes ist das allerdings nur ein Tropfen auf den heißen Stein, umgerechnet etwa drei Prozent.

Opt-outs über ArtStation und Shutterstock

Spawning baute bei der Umsetzung des Opt-out auf Partnerschaften mit Anbietern wie ArtStation und Shutterstock. Auch über diese Plattformen konnten Kunstschaffende das Training mit ihren Werken ablehnen oder die Bilder wurden standardmäßig ausgeschlossen. Über 40.000 Verzichtserklärungen wurden direkt über haveibeentrained.com abgegeben.

Jeder Urheberrechtsanspruch wurde von Spawning manuell geprüft. Tools, um mehrere Bilder individueller Künstler:innen auf einen Schlag auszutragen, sind in Arbeit, waren jedoch bis zur Frist für Stable Diffusion 3 noch nicht fertig. Die Plattform ermöglicht Künstler:innen auch, ihre Werke explizit für das KI-Training freizugeben, wenn sie noch nicht im Datensatz enthalten sind.

Wir haben diese Dienste kostenlos zur Verfügung gestellt.

Wir sind davon überzeugt, dass die einvernehmliche Bereitstellung von Daten sowohl für KI-Organisationen als auch für die Menschen, an denen diese Systeme trainiert werden, von großem Nutzen sein wird.

Wir haben kürzlich ein von Menschen verifiziertes Artist-Opt-in eingeführt und arbeiten an weiteren Tools und Partnerschaften.

Spawning

Das Opt-out-Verfahren kommt bei den Künstler:innen nicht nur positiv an. Viele halten ein generelles Opt-in-Verfahren für besser, das heißt, dass die Bilder proaktiv für das Trainingsmaterial zur Verfügung gestellt werden müssen. Die Notwendigkeit, sich auf einer Website zu registrieren und damit noch mehr Daten preiszugeben, wird von einigen als der falsche Weg angesehen.

Großes Zeichen, kleine Wirkung

Alles in allem ist das Opt-out dennoch ein gutes Zeichen und ein wichtiger Baustein für die Weiterentwicklung von KI-Modellen. Die Stile mancher Künstler:innen dürften mit Stable Diffusion 3 nicht mehr nativ reproduziert werden können.

Dass die Debatte bei den Bildgeneratoren heftiger geführt wird als bei Sprachmodellen, mag daran liegen, dass Plagiate bestimmter Stile hier am schnellsten auffallen. Aber auch Verlage und Autor:innen haben ein Bedürfnis, ihre Werke von Sprachmodellen fernzuhalten.

Es ist jedoch fraglich, ob KI-Modelle selbst mit Opt-in-Verfahren in Zukunft nicht mehr auf urheberrechtlich geschütztes Material zur Bildgenerierung zurückgreifen werden. Schließlich wird es für Anwender:innen immer einfacher, Stable Diffusion mit eigenen Bildern zu füttern, unter anderem durch die neue ControlNet-Methode. Die Verantwortung wird sich daher wahrscheinlich nur von den Unternehmen auf die Privatpersonen verlagern.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Stable Diffusion 3: Künstler entfernen 80 Millionen Bilder aus Trainingsdaten

Opt-outs über ArtStation und Shutterstock

Großes Zeichen, kleine Wirkung

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.