Inhalt
summary Zusammenfassung

Anthropic soll seine KI Claude mit Reddit-Daten trainiert haben – ohne Zustimmung des Plattformbetreibers. Reddit sieht darin einen Vertragsbruch und klagt auf Schadensersatz und Unterlassung.

Anzeige

Reddit hat beim Superior Court in San Francisco Klage gegen das KI-Unternehmen Anthropic eingereicht. Der Vorwurf: Anthropic habe systematisch Inhalte von Reddit per automatisierter Datensammlung (Scraping) ohne Genehmigung entnommen und zur Entwicklung seiner Claude-Modelle verwendet. Das verstoße gegen Reddits Nutzungsbedingungen.

Laut Reddit ist die kommerzielle Nutzung von Plattforminhalten durch Dritte nur mit ausdrücklicher Zustimmung erlaubt. Reddit verweist auf seine Nutzungsvereinbarung, die automatisiertes Scraping untersagt, sowie auf technische Schutzmaßnahmen wie robots.txt-Dateien, IP-Ratenbegrenzungen und eine Compliance-API, über die Lizenznehmer über gelöschte Inhalte informiert werden.

Ohne automatisierte Lösch-Benachrichtigungen über die Compliance-API könne Claude weiterhin Inhalte ausgeben, die Nutzer auf Reddit längst entfernt hätten. Das gefährde Privatsphäre und Vertrauen der Community, argumentiert das Unternehmen.

Anzeige
Anzeige

Trainingsdaten aus mehr als 40 Subreddits

Ein Sprecher von Anthropic habe im Juli 2024 erklärt, Reddit stehe seit Mai auf der Blockliste für ClaudeBot. Reddit führt dagegen Server-Logs an, die über 100.000 Zugriffe von ClaudeBot in den Folgemonaten dokumentieren.

Anthropic habe zudem in früheren Forschungsarbeiten öffentlich eingeräumt, Reddit-Inhalte zur Feinabstimmung seiner Sprachmodelle verwendet zu haben. Dabei wurden mehr als 40 Subreddits als besonders hochwertige Datenquellen genannt, darunter r/science, r/IAmA und r/relationship_advice. Die Daten seien laut Reddit ohne Zustimmung und unter Umgehung technischer Schutzmaßnahmen beschafft worden.

Trotz Aufforderung habe Anthropic kein Lizenzabkommen abgeschlossen, anders als etwa OpenAI oder Google, die laut Reddit entsprechende Verträge unterzeichnet und sich zur Einhaltung datenschutzrechtlicher Vorgaben verpflichtet hätten.

Lizenz-Erlöse, Löschung, Marktstopp

Reddit wirft Anthropic Vertragsbruch, unlautere Bereicherung, Besitzstörung, Eingriff in bestehende Vertragsverhältnisse und unlauteren Wettbewerb vor. Das Unternehmen fordert Schadensersatz für entgangene Lizenzeinnahmen sowie eine gerichtliche Anordnung zur Löschung aller mit Reddit-Daten trainierten KI-Modelle. Zudem solle Anthropic künftig daran gehindert werden, Claude oder andere Modelle, die auf Reddit-Inhalten basieren, weiter kommerziell zu nutzen.

Reddit sieht durch das Verhalten von Anthropic neben verletzten wirtschaftliche Interessen auch die Privatsphäre seiner Nutzer gefährdet. Ohne formale Lizenz und technische Anbindung an die Compliance-API sei nicht nachvollziehbar, ob sensible oder gelöschte Inhalte weiterhin im Claude-System enthalten seien.

Empfehlung

Reddit ist unter anderem mit Google im Bunde, das für die Datennutzung fürs KI-Training bezahlt hat. Im Gegenzug spendierte Google Reddit in den vergangenen Monaten enorme Sichtbarkeit in der Google-Suche.

Anthropic hat sich zu den Vorwürfen in der Klageschrift bislang nicht geäußert.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Reddit hat Klage gegen Anthropic eingereicht und wirft dem Unternehmen vor, ohne Erlaubnis systematisch Inhalte von Subreddits für das Training seiner KI-Modelle gesammelt und verwendet zu haben.
  • Reddit betont, dass Anthropic damit gegen die eigenen Nutzungsbedingungen, technische Schutzmaßnahmen und das Fehlen eines Lizenzabkommens verstoßen habe, was wirtschaftliche Interessen und den Schutz gelöschter oder sensibler Nutzerdaten gefährde.
  • Reddit fordert Schadensersatz, die Löschung aller mit Reddit-Daten trainierten Modelle sowie ein Verbot der weiteren kommerziellen Nutzung dieser KI-Systeme durch Anthropic.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!