Short

Reddit gab am Freitag im Rahmen seines bevorstehenden Börsengangs bekannt, dass das Unternehmen von der Federal Trade Commission (FTC) wegen seiner Datenlizenzierungspraktiken untersucht wird. Die FTC teilte Reddit mit, dass sie eine nicht öffentliche Untersuchung der Praktiken durchführe, mit denen nutzergenerierte Inhalte verkauft, lizenziert oder an Dritte weitergegeben werden, um KI-Modelle zu trainieren. Reddit betonte, dass diese Praktiken nicht im Widerspruch zu den Werten und Rechten seiner Nutzer stünden. Das Unternehmen rechnet damit, allein aus dem im Januar mit Google geschlossenen Datenlizenzvertrag 2024 rund 60 Millionen US-Dollar zu erwirtschaften. Reddit geht davon aus, dass seine wachsenden Plattformdaten ein Schlüsselelement für das Training von führenden Large Language Models (LLMs) sein und als zusätzlicher Monetarisierungskanal dienen werden.

Anzeige
Anzeige
Short

Nvidia reiht sich in die Liste der KI-Giganten ein, die wegen möglicher Urheberrechtsverletzungen beim KI-Training verklagt werden. Die Autoren Brian Keene, Abdi Nazemian und Stewart O'Nan behaupten, dass ihre Werke Teil eines Datensatzes von rund 196.640 Büchern sind, die für das Training von Nvidias KI-Framework NeMo verwendet wurden. Nvidia NeMo ermöglicht es Unternehmen, vortrainierte große Sprachmodelle anzupassen, einzusetzen und zu verfeinern. In einer Sammelklage, die am Freitagabend in San Francisco eingereicht wurde, fordern die Autoren Schadensersatz für Einzelpersonen in den USA, deren urheberrechtlich geschützte Werke in den vergangenen drei Jahren zum Training der NeMo-Sprachmodelle verwendet wurden. Mehrere Autoren haben KI-Unternehmen wie Meta, OpenAI und Microsoft wegen Urheberrechtsverletzungen verklagt. Die Autoren behaupten, dass die KI-Firmen ihre Bücher ohne Erlaubnis zum Training von KI-Modellen wie GPT-4 verwendet haben. Stephen King findet das in Ordnung.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Short

Google hat ein kalifornisches Bundesgericht aufgefordert, eine geplante Sammelklage abzuweisen, in der behauptet wird, dass die Datenauswahl des Unternehmens für generative KI die Privatsphäre und Eigentumsrechte verletze.

Der Tech-Riese verteidigt seine Nutzung öffentlicher Daten zum Trainieren von Systemen wie seinem Chatbot Bard und argumentiert, dass die Klage "nicht nur Googles Dienste, sondern auch die Idee der generativen KI mit dem Vorschlaghammer treffen würde" und dass "die Nutzung öffentlich verfügbarer Informationen zum Lernen kein Diebstahl ist". Die Klage wurde im Juli von acht Einzelpersonen eingereicht, die Google vorwerfen, Inhalte aus sozialen Medien und Google-Plattformen für das Training von KI zu missbrauchen. Googles Rechtsberaterin Halimah DeLaine Prado bezeichnete die Klage als "unbegründet" und sagte, das US-Recht unterstütze die Nutzung öffentlicher Informationen für neue nützliche Zwecke.

Google News