Der Medienkonzern Ziff Davis hat OpenAI vor dem US-Bezirksgericht in Delaware verklagt. Die Vorwürfe wiegen schwer: massive Urheberrechtsverletzungen, Verstöße gegen den Digital Millennium Copyright Act (DMCA), unrechtmäßige Bereicherung und Markenverwässerung.
Laut Klageschrift hat OpenAI systematisch und wissentlich Inhalte von Ziff Davis ohne Erlaubnis für seine KI-Sprachmodelle genutzt. Der KI-Konzern soll Texte von Ziff Davis-Websites kopiert, Verbote und technische Schutzmaßnahmen umgangen sowie Copyright-Informationen wie Urheberrechtsvermerke und Quellenangaben entfernt haben. Diese Inhalte seien dann zum Training der KI-Modelle und zur Generierung von Antworten in Produkten wie ChatGPT verwendet worden.
Ziff Davis, zu dem mehr als 45 Digital-Marken wie IGN, Mashable, CNET, ZDNET, PCMag und Everyday Health gehören, erstellt nach eigenen Angaben jährlich fast zwei Millionen neue Artikel und Updates.
Die Klageschrift dokumentiert das mutmaßliche Vorgehen von OpenAI detailliert: Trotz ausdrücklicher Verbote in der robots.txt-Datei habe das Unternehmen Web-Crawler wie den "GPTBot" eingesetzt, um Inhalte zu sammeln. Die Aktivität des Crawlers sei sogar gestiegen, nachdem Ziff Davis OpenAI im Mai 2024 zur Unterlassung aufgefordert hatte.
Mit spezieller Software soll OpenAI systematisch Copyright-Informationen aus den kopierten Artikeln entfernt haben. Als Beleg führt die Klage Beispiele aus OpenAIs öffentlich zugänglichem "WebText"-Datensatz an, die komplette Ziff Davis-Artikel ohne Quellenangaben zeigen. Analysen verschiedener Trainingsdatensätze würden belegen, dass Ziff Davis-Inhalte darin millionenfach enthalten und im Vergleich zu ihrer Web-Präsenz überrepräsentiert seien.
Direkte Reproduktion und falsche Attributionen
Tests der Kläger hätten gezeigt, dass OpenAI-Modelle wie GPT-4o und o3-mini auch ohne Internetzugang wortgleiche oder fast identische Passagen aus Ziff Davis-Artikeln reproduzieren können. Dies deute laut Klageschrift auf ein "Auswendiglernen" der Trainingsdaten hin. Bei aktiviertem Webzugriff würden die Modelle zudem gezielt auf Ziff Davis-Inhalte zurückgreifen, um Antworten zu generieren.

Ein weiterer Vorwurf betrifft die Ausgabe irreführender oder falscher Informationen durch OpenAI-Produkte. Laut Ziff Davis würden die Modelle Inhalte falsch zusammenfassen, Artikel des Verlags falsch oder gar nicht zitieren, Links zu nicht existierenden Artikeln generieren oder Fakten "halluzinieren" und fälschlicherweise Ziff Davis zuschreiben. Dies verwässere die Marke des Medienkonzerns und schade seinem Ruf als vertrauenswürdige Informationsquelle.

Auch andere Studien haben gezeigt, dass Chatbots Nachrichteninhalte falsch wiedergeben oder falsche Quellen zitieren können.
Ziff Davis bekam keinen Lizenz-Deal
Ziff Davis sieht in den KI-generierten Inhalten eine existenzielle Bedrohung für sein Geschäftsmodell. Diese konkurrierten direkt mit den Originalartikeln und lenkten Nutzerverkehr ab, was das werbe- und provisionsbasierte Geschäft untergrabe. OpenAI profitiere von den Investitionen und der Arbeit von Ziff Davis, ohne dafür zu zahlen, während es mit anderen Verlagen Lizenzabkommen abschließe.
In der Klage fordert Ziff Davis neben Schadensersatz und der Übernahme von Anwaltskosten auch eine dauerhafte Unterlassungsverfügung. Besonders weitreichend ist die Forderung, alle OpenAI-Trainingsdatensätze und KI-Modelle zu zerstören, die urheberrechtlich geschützte Werke von Ziff Davis enthalten oder daraus abgeleitet wurden. Versuche des Verlags, vor der Klage eine Lizenzvereinbarung auszuhandeln, seien von OpenAI abgelehnt worden.
OpenAIs Lizenz-Deals mit Medienunternehmen sind undurchsichtig
In jüngster Zeit haben OpenAI und andere KI-Unternehmen weitgehend intransparente Lizenzabkommen mit ausgewählten Medienhäusern geschlossen. Diese Deals, die oft rückwirkend gelten, dürften auch dazu dienen, potenzielle Klagen wegen der Nutzung von Inhalten für das KI-Training abzuwenden – der Journalismusforscher Jeff Jarvis bezeichnete entsprechende Zahlungen als "Schweigegeld".
Problematisch ist dabei, dass KI-Unternehmen somit zu Gatekeepern werden, die selektiv entscheiden, welche Verlage finanziell profitieren. Diese Machtkonzentration ist potenziell schädlicher für die Medienvielfalt als die bisherige Abhängigkeit von Suchmaschinen wie Google, da Nutzer das Ökosystem von Chatbots selten bis gar nicht verlassen.
Die Klage ist nur eine von vielen zwischen Content-Anbietern und KI-Unternehmen. Allein OpenAI dürfte in mehr als 15 Klagen involviert sein. Als Flaggschiff-Klage im Bereich Text gilt der Rechtsstreit zwischen der New York Times und OpenAI.