KI in der Praxis

Photobucket & Co. machen Kasse: KI-Giganten zahlen Milliarden für alte Datenarchive

Matthias Bastian
US Dollar sign Made Completely from Computer Code zeroes and ones 0101000101001001010101 matrix like

Midjourney prompted by THE DECODER

Photobucket und andere Internetveteranen verdienen jetzt Geld mit ihren alten Datenarchiven, indem sie diese an Technologieunternehmen lizenzieren, um damit KI-Modelle zu trainieren.

Große Technologieunternehmen wie Google, Meta, Microsoft und OpenAI lizenzieren derzeit im großen Stil Bilder, Videos und andere Inhalte, um ihre KI-Modelle zu trainieren. Brancheninsidern zufolge zahlen sie dafür zwischen 5 Cent und 1 Dollar pro Foto und mehr als 1 Dollar pro Video, je nach Käufer und Art des Materials, berichtet Reuters.

Die Preise können stark schwanken: Die Firma Defined.ai, die Daten an Google, Meta, Apple, Amazon und Microsoft lizenziert, nennt Preise von 1 bis 2 Dollar pro Bild, 2 bis 4 Dollar für kurze Videos und 100 bis 300 Dollar pro Stunde für längere Filme. Nacktbilder, die besonders sensibel behandelt werden müssen, kosten sogar 5 bis 7 Dollar pro Bild. Text kostet 0,001 Dollar pro Wort.

Photobucket-CEO Ted Leonard verhandelt derzeit mit mehreren Technologiefirmen über die Lizenzierung von 13 Milliarden Fotos und Videos zu Preisen zwischen 5 Cent und 1 Dollar pro Foto und mehr als 1 Dollar pro Video. Sein Unternehmen könne die Nachfrage nicht befriedigen: Ein Käufer habe Milliarden von Videos angefragt.

Shutterstock hat mit Apple, Meta, Google und Amazon Verträge über die Nutzung von hunderten Millionen Bildern, Videos und Musikdateien abgeschlossen. Die ersten Deals hatten ein Volumen von 25 bis 50 Millionen Dollar, wurden aber ausgeweitet. Auch OpenAI gehörte zu den ersten Kunden.

Die spanische Plattform Freepik lizenzierte den Großteil ihres 200 Millionen Bilder umfassenden Archivs für 2 bis 4 Cent pro Bild an zwei große Technologieunternehmen. Fünf weitere ähnliche Deals sind laut CEO Joaquin Cuenca Abela in Vorbereitung.

Ist der Nutzerdaten-Verkauf legitim?

Rechtlich sieht sich Photobucket-CEO Ted Leonard auf der sicheren Seite. Er verweist auf eine Aktualisierung der Nutzungsbedingungen im Oktober, die dem Unternehmen das "uneingeschränkte Recht" einräume, hochgeladene Inhalte für das Training von KI-Systemen zu verkaufen. Er sieht die Lizenzierung als Alternative zur Werbung, um weiterhin kostenlose Accounts anbieten zu können.

Die US-Handelsbehörde FTC warnte Unternehmen jedoch im Februar davor, Nutzungsbedingungen rückwirkend für den Einsatz von KI zu ändern.

Es kann unlauter oder irreführend sein, wenn ein Unternehmen freizügigere Datenpraktiken einführt - z. B. die Weitergabe von Verbraucherdaten an Dritte oder die Verwendung dieser Daten für KI-Training - und die Verbraucher nur durch eine heimliche, rückwirkende Änderung seiner Nutzungsbedingungen oder Datenschutzrichtlinien über diese Änderung informiert.

FTC

Die Behörde untersucht einen Trainingsdaten-Deal, den Reddit mit Google abgeschlossen hat. Reddit gilt als einer der wichtigsten Datenlieferanten für KI-Unternehmen.

Quellen: