Die KI-Firma Anthropic einigt sich in einem historischen Vergleich mit US-Autoren und Verlagen auf eine Entschädigung für die Nutzung raubkopierter Bücher. Der Fall könnte die Regeln für KI-Training mit urheberrechtlich geschützten Inhalten verändern.
Anthropic wird mindestens 1,5 Milliarden US-Dollar an US-amerikanische Autorinnen, Autoren und Verlage zahlen, um eine Sammelklage wegen Urheberrechtsverletzungen beizulegen, in der dem Unternehmen eine "Napster-ähnliche" Piraterie vorgeworfen wurde. Das geht aus einem am 5. September 2025 eingereichten Antrag auf vorläufige Genehmigung des Vergleichs beim zuständigen Bundesgericht in Kalifornien hervor.
Die Sammelklage drehte sich um den massenhaften Download und die Speicherung von Büchern aus Piratenquellen wie Library Genesis (LibGen) und Pirate Library Mirror (PiLiMi). Die Kläger warfen Anthropic vor, rund 500.000 urheberrechtlich geschützte Werke ohne Lizenz verwendet zu haben.
3.000 Dollar pro Buch und keine Absolution für künftige Verstöße
Der Vergleich sieht vor, dass Anthropic in vier Raten innerhalb von zwei Jahren mindestens 1,5 Milliarden US-Dollar in einen nicht rückzahlbaren Fonds einzahlt. Bei rund 500.000 betroffenen Werken ergibt sich ein durchschnittlicher Bruttobetrag von etwa 3.000 US-Dollar pro Werk. Sollte sich die endgültige Anzahl der Werke erhöhen, zahlt Anthropic für jedes zusätzliche Werk weitere 3.000 US-Dollar.
Die Einigung bezieht sich ausschließlich auf vergangene Verstöße bis zum 25. August 2025. Insbesondere werden keine Ansprüche im Zusammenhang mit KI-Ausgaben ("Outputs") freigegeben – weder vergangene noch zukünftige. Auch Werke, die nicht auf der finalen "Works List" stehen, sind vom Vergleich nicht erfasst.
Zusätzlich verpflichtet sich Anthropic, alle aus LibGen und PiLiMi stammenden Dateien sowie daraus abgeleitete Kopien zu löschen, spätestens 30 Tage nach Abschluss des Verfahrens oder dem Ende etwaiger gerichtlicher Aufbewahrungspflichten.
Die Verteilung der Mittel erfolgt pro Werk – nicht pro Anspruchsteller. Bei Mehrfachansprüchen, etwa durch Autor und Verlag, soll ein Arbeitskreis der Authors Guild und der Association of American Publishers Lösungsvorschläge erarbeiten.
Die Preisfindung für Trainingsdaten ist schwierig, da es noch keinen etablierten Markt dafür gibt. Genau dieser beginnt sich nun unter dem Druck solcher Gerichtsverfahren zu formen. Zum Vergleich: Microsoft hatte zuvor proaktiv mit dem Verlag HarperCollins einen Lizenzdeal über US-Dollar pro Buch abgeschlossen, um diese für das KI-Training nutzen zu können. Anthropic liegt mit rund 3.000 US-Dollar pro Werk also deutlich darunter.
Für KI-Unternehmen, die sich bisher auf frei verfügbare oder vermeintlich "preislose" Inhalte gestützt haben, steigt damit der Druck. Wenn urheberrechtlich geschützte Werke durch Vergleiche oder Urteile plötzlich ein Preisschild bekommen, dürfte das Auswirkungen auf künftige Lizenzverhandlungen und Geschäftsmodelle in der KI-Industrie haben: In Fair-Use-Verfahren wird regelmäßig geprüft, ob durch die Nutzung urheberrechtlich geschützter Werke ein potenzieller Markt für die Rechteinhaber beeinträchtigt wird. Je klarer sich ein Markt für Lizenzen herausbildet, desto schwieriger wird es für KI-Unternehmen vor Gericht zu argumentieren, dass ihre Nutzung als "fair" und folgenlos einzustufen ist. Entsprechende Vergleiche und Lizenzdeals könnten daher die Fair-Use-Argumentation künftig weiter schwächen.
Gericht warf Anthropic "Napster-ähnliche" Piraterie vor
Anthropics Entscheidung, eine Abfindung zu zahlen und damit einen Präzedenzfall zu schaffen, kommt nicht von ungefähr: Im Juli 2025 hatte das Bundesgericht in San Francisco die Sammelklage gegen das Unternehmen zugelassen – und schon in der Zulassung harsch geurteilt.
Es sprach von einer "Napster-ähnlichen Urheberrechtsverletzung" und betonte, dass Fair Use nicht für Raubkopien gelte. Selbst wenn die spätere Nutzung transformativ sei, könne dies die rechtswidrige Beschaffung nicht rechtfertigen.
Bereits im Juni 2025 hatte das Gericht im Rahmen eines Teilurteils festgestellt, dass das Training von KI-Modellen mit urheberrechtlich geschützten Büchern unter bestimmten Bedingungen als Fair Use zulässig sein kann – allerdings nur, wenn die Werke legal beschafft wurden. Für Inhalte aus Piratenquellen wie LibGen, PiLiMi oder Books3 gelte das ausdrücklich nicht.
Die Entscheidung ist insofern richtungsweisend, als sie bestätigt, dass auch KI-Unternehmen beim Datenbezug an das Urheberrecht gebunden sind. Unklar bleibt jedoch, wo genau die Grenze zur Rechtswidrigkeit verläuft. Während bei eindeutig illegal beschafften Daten – etwa aus Piratenquellen – nun klare juristische Maßstäbe gelten, besteht bei öffentlich zugänglichen Internetinhalten weiterhin ein Graubereich. Viele dieser Inhalte wurden ohne Einwilligung der Urheber oder Webseitenbetreiber für das KI-Training extrahiert, obwohl sie ursprünglich nicht für diesen Zweck veröffentlicht wurden. Ob und in welchem Umfang solche Daten künftig als lizenzpflichtig gelten, ist nicht absehbar.