Im Februar führte die 3D-Datenbank Sketchfab einen NoAI-Tag für Urheber:innen ein. Doch das war wohl zu spät, wie sich jetzt zeigt.
Spätestens mit der neuesten Variante generativer KI-Modelle wie DALL-E 2, Midjourney, Stable Diffusion, ChatGPT oder GPT-4 kam das böse Erwachen: KI-Modelle für Bilder, Texte und Code haben das Potenzial, Tätigkeiten dramatisch zu verändern und können vor allem Menschen, deren jahrelange Arbeit als Trainingsdaten aus dem Internet massenhaft und automatisiert gesammelt wurden, den Job kosten.
Als Folge sind Gerichtsverfahren im Gange, die klären sollen, ob nach Creative-Commons-Lizenz freigegebene Daten auch frei für das KI-Training sind. In manchen Fällen geben Unternehmen wie Stability AI Künstler:innen die Möglichkeit, sich aus den Trainingsdaten austragen zu lassen oder kompensieren sie für ihre Teilnahme, wie etwa Adobe oder Getty Images.
Viele öffentliche Datenbanken haben außerdem neue Bedingungen eingeführt, die Urheber:innen die Möglichkeit geben, die Nutzung ihrer Daten für das KI-Training zu verbieten.
Generative KI-Modelle für 3D zeichnen sich ab
Nach Text, Code und Bildern zeichnet sich schon länger ab, dass generative KI-Modelle für 3D-Inhalte das nächste Ziel des Trends sein werden. Erste Modelle existieren bereits, sind aber qualitativ noch weit von ihren Text- und 2D-Varianten entfernt. Der Hauptgrund dafür ist das Fehlen eines großen Datensatzes mit 3D-Inhalten.
Das hat sich nun geändert: Forschende des Allen Institute for AI und der University of Washington haben mit Objaverse einen gigantischen 3D-Datensatz veröffentlicht. Objaverse umfasst mehr als 800.000 3D-Modelle mit Beschreibungen, darunter mehr als 44.000 animierte 3D-Objekte.
Damit ist Objaverse um mehr als eine Größenordnung größer als der bisher größte Datensatz Shapenet und umfasst fast 400-mal so viele Kategorien, darunter auch fotorealistische Modelle.
Objaverse-Daten stammen aus Sketchfab
Die Daten von Objaverse stammen von der 3D-Plattform Sketchfab und stehen unter der Creative Commons License. Die Urheber:innen, deren 3D-Modelle im Datensatz enthalten sind, wurden nicht darüber informiert, dass ihre Daten für das KI-Training gesammelt wurden.
Dies ist besonders brisant, da sich im Datensatz auch 3D-Modelle befinden, deren Urheber:innen den im Februar von Sketchfab eingeführten NoAI-Tag gesetzt haben. Dieser soll genau das verhindern, was jetzt passiert ist.
I used the NOAi tag on @Sketchfab how do you have my models? @EpicGames
— Austin Beaulier (@AustinBeaulier) March 24, 2023
Das Unternehmen hat auch eine direkte Vereinbarung mit EpicGames, das Sketchfab im Sommer 2021 gekauft hat, dass die gehosteten 3D-Modelle nicht von EpicGames für das Training von generativen KI-Modellen verwendet werden dürfen.
Sketchfabs NoAI-Tag kam zu spät
"Es scheint, dass Objaverse diese Modelle massenhaft von Sketchfab heruntergeladen und ohne unser Wissen weiterverbreitet hat. Bis jetzt wurden alle Modelle, die wir gesehen haben, auf Sketchfab unter Creative Commons Lizenzen zum kostenlosen Download angeboten", so Sketchfab in einer Stellungnahme. Das Problem: "Sie haben das getan, bevor wir den NoAI-Tag eingeführt haben", so Alban Denoyel, Mitbegründer und CEO von Sketchfab.
Looks like I'm blocked by @lizaledwards.
Just a few things for context:
- those models were mass aggregated by objaverse without our knowledge
- they did this before us implementing the noai tag
- it's CC content set downloable by users
- we are looking into what resort we have— alban denoyel (@albn) March 24, 2023
Kurz: Sketchfab hat mit dem NoAI-Tag Maßnahmen gegen eine solche Situation ergriffen - aber es war zu spät. "Wir verstehen die Besorgnis der Künstler:innen und werden die Angelegenheit prüfen", so das Unternehmen.
Ob die Urheber:innen eine legale Handhabe gegen den Datensatz haben, wird sich wohl erst in den nächsten Monaten zeigen. Da sollten erste Ergebnisse aus den Verfahren im Streit um generative KI-Modelle für Text-zu-Bild verfügbar sein.
Mehr Informationen zum Objaverse gibt es auf der Objaverse-Projektseite.