Reddit verklagt Anthropic wegen unerlaubten Daten-Scrapings fürs KI-Training

4. Juni 2025

GPT-Image-1 prompted by THE DECODER

Anthropic soll seine KI Claude mit Reddit-Daten trainiert haben – ohne Zustimmung des Plattformbetreibers. Reddit sieht darin einen Vertragsbruch und klagt auf Schadensersatz und Unterlassung.

Reddit hat beim Superior Court in San Francisco Klage gegen das KI-Unternehmen Anthropic eingereicht. Der Vorwurf: Anthropic habe systematisch Inhalte von Reddit per automatisierter Datensammlung (Scraping) ohne Genehmigung entnommen und zur Entwicklung seiner Claude-Modelle verwendet. Das verstoße gegen Reddits Nutzungsbedingungen.

Laut Reddit ist die kommerzielle Nutzung von Plattforminhalten durch Dritte nur mit ausdrücklicher Zustimmung erlaubt. Reddit verweist auf seine Nutzungsvereinbarung, die automatisiertes Scraping untersagt, sowie auf technische Schutzmaßnahmen wie robots.txt-Dateien, IP-Ratenbegrenzungen und eine Compliance-API, über die Lizenznehmer über gelöschte Inhalte informiert werden.

Ohne automatisierte Lösch-Benachrichtigungen über die Compliance-API könne Claude weiterhin Inhalte ausgeben, die Nutzer auf Reddit längst entfernt hätten. Das gefährde Privatsphäre und Vertrauen der Community, argumentiert das Unternehmen.

Trainingsdaten aus mehr als 40 Subreddits

Ein Sprecher von Anthropic habe im Juli 2024 erklärt, Reddit stehe seit Mai auf der Blockliste für ClaudeBot. Reddit führt dagegen Server-Logs an, die über 100.000 Zugriffe von ClaudeBot in den Folgemonaten dokumentieren.

Anthropic habe zudem in früheren Forschungsarbeiten öffentlich eingeräumt, Reddit-Inhalte zur Feinabstimmung seiner Sprachmodelle verwendet zu haben. Dabei wurden mehr als 40 Subreddits als besonders hochwertige Datenquellen genannt, darunter r/science, r/IAmA und r/relationship_advice. Die Daten seien laut Reddit ohne Zustimmung und unter Umgehung technischer Schutzmaßnahmen beschafft worden.

Trotz Aufforderung habe Anthropic kein Lizenzabkommen abgeschlossen, anders als etwa OpenAI oder Google, die laut Reddit entsprechende Verträge unterzeichnet und sich zur Einhaltung datenschutzrechtlicher Vorgaben verpflichtet hätten.

Lizenz-Erlöse, Löschung, Marktstopp

Reddit wirft Anthropic Vertragsbruch, unlautere Bereicherung, Besitzstörung, Eingriff in bestehende Vertragsverhältnisse und unlauteren Wettbewerb vor. Das Unternehmen fordert Schadensersatz für entgangene Lizenzeinnahmen sowie eine gerichtliche Anordnung zur Löschung aller mit Reddit-Daten trainierten KI-Modelle. Zudem solle Anthropic künftig daran gehindert werden, Claude oder andere Modelle, die auf Reddit-Inhalten basieren, weiter kommerziell zu nutzen.

Reddit sieht durch das Verhalten von Anthropic neben verletzten wirtschaftliche Interessen auch die Privatsphäre seiner Nutzer gefährdet. Ohne formale Lizenz und technische Anbindung an die Compliance-API sei nicht nachvollziehbar, ob sensible oder gelöschte Inhalte weiterhin im Claude-System enthalten seien.

Reddit ist unter anderem mit Google im Bunde, das für die Datennutzung fürs KI-Training bezahlt hat. Im Gegenzug spendierte Google Reddit in den vergangenen Monaten enorme Sichtbarkeit in der Google-Suche.

Anthropic hat sich zu den Vorwürfen in der Klageschrift bislang nicht geäußert.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 16 % Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: “KI Radar” – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Reddit verklagt Anthropic wegen unerlaubten Daten-Scrapings fürs KI-Training

Trainingsdaten aus mehr als 40 Subreddits

Lizenz-Erlöse, Löschung, Marktstopp

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.