Inhalt
summary Zusammenfassung
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
KI bei der Bundeswehr und der BWI | DEEP MINDS #16

Im Februar führte die 3D-Datenbank Sketchfab einen NoAI-Tag für Urheber:innen ein. Doch das war wohl zu spät, wie sich jetzt zeigt.

Spätestens mit der neuesten Variante generativer KI-Modelle wie DALL-E 2, Midjourney, Stable Diffusion, ChatGPT oder GPT-4 kam das böse Erwachen: KI-Modelle für Bilder, Texte und Code haben das Potenzial, Tätigkeiten dramatisch zu verändern und können vor allem Menschen, deren jahrelange Arbeit als Trainingsdaten aus dem Internet massenhaft und automatisiert gesammelt wurden, den Job kosten.

Als Folge sind Gerichtsverfahren im Gange, die klären sollen, ob nach Creative-Commons-Lizenz freigegebene Daten auch frei für das KI-Training sind. In manchen Fällen geben Unternehmen wie Stability AI Künstler:innen die Möglichkeit, sich aus den Trainingsdaten austragen zu lassen oder kompensieren sie für ihre Teilnahme, wie etwa Adobe oder Getty Images.

Viele öffentliche Datenbanken haben außerdem neue Bedingungen eingeführt, die Urheber:innen die Möglichkeit geben, die Nutzung ihrer Daten für das KI-Training zu verbieten.

Anzeige
Anzeige

Generative KI-Modelle für 3D zeichnen sich ab

Nach Text, Code und Bildern zeichnet sich schon länger ab, dass generative KI-Modelle für 3D-Inhalte das nächste Ziel des Trends sein werden. Erste Modelle existieren bereits, sind aber qualitativ noch weit von ihren Text- und 2D-Varianten entfernt. Der Hauptgrund dafür ist das Fehlen eines großen Datensatzes mit 3D-Inhalten.

Das hat sich nun geändert: Forschende des Allen Institute for AI und der University of Washington haben mit Objaverse einen gigantischen 3D-Datensatz veröffentlicht. Objaverse umfasst mehr als 800.000 3D-Modelle mit Beschreibungen, darunter mehr als 44.000 animierte 3D-Objekte.

Die Qualität der 3D-Modelle im Objaverse-Datensatz sind deutlich höher, als im bisher besten verfügbaren Datensatz ShapeNet. | Bild: Screenshot von AI2 Objaverse Webseite

Damit ist Objaverse um mehr als eine Größenordnung größer als der bisher größte Datensatz Shapenet und umfasst fast 400-mal so viele Kategorien, darunter auch fotorealistische Modelle.

Objaverse umfasst über 800.000 3D-Modelle von Sketchfab. | Bild: Deitke et al.

Objaverse-Daten stammen aus Sketchfab

Die Daten von Objaverse stammen von der 3D-Plattform Sketchfab und stehen unter der Creative Commons License. Die Urheber:innen, deren 3D-Modelle im Datensatz enthalten sind, wurden nicht darüber informiert, dass ihre Daten für das KI-Training gesammelt wurden.

Dies ist besonders brisant, da sich im Datensatz auch 3D-Modelle befinden, deren Urheber:innen den im Februar von Sketchfab eingeführten NoAI-Tag gesetzt haben. Dieser soll genau das verhindern, was jetzt passiert ist.

Empfehlung

Das Unternehmen hat auch eine direkte Vereinbarung mit EpicGames, das Sketchfab im Sommer 2021 gekauft hat, dass die gehosteten 3D-Modelle nicht von EpicGames für das Training von generativen KI-Modellen verwendet werden dürfen.

Sketchfabs NoAI-Tag kam zu spät

"Es scheint, dass Objaverse diese Modelle massenhaft von Sketchfab heruntergeladen und ohne unser Wissen weiterverbreitet hat. Bis jetzt wurden alle Modelle, die wir gesehen haben, auf Sketchfab unter Creative Commons Lizenzen zum kostenlosen Download angeboten", so Sketchfab in einer Stellungnahme. Das Problem: "Sie haben das getan, bevor wir den NoAI-Tag eingeführt haben", so Alban Denoyel, Mitbegründer und CEO von Sketchfab.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Kurz: Sketchfab hat mit dem NoAI-Tag Maßnahmen gegen eine solche Situation ergriffen - aber es war zu spät. "Wir verstehen die Besorgnis der Künstler:innen und werden die Angelegenheit prüfen", so das Unternehmen.

Ob die Urheber:innen eine legale Handhabe gegen den Datensatz haben, wird sich wohl erst in den nächsten Monaten zeigen. Da sollten erste Ergebnisse aus den Verfahren im Streit um generative KI-Modelle für Text-zu-Bild verfügbar sein.

Mehr Informationen zum Objaverse gibt es auf der Objaverse-Projektseite.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Objaverse ist ein neuer Datensatz für 3D-Modelle, der eine generative KI für 3D ermöglichen soll. Die Daten stammen von Sketchfab.
  • Das Unternehmen erklärte, die Daten seien ohne sein Wissen massenhaft gesammelt worden.
  • Im Februar hatte Sketchfab einen NoAI-Tag eingeführt, um genau das zu verhindern - zu spät, wie sich jetzt herausstellt.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!