Anzeige
Skip to content

Encyclopedia Britannica verklagt OpenAI wegen massenhafter Urheberrechtsverletzung

Image description
Nano Banana Pro prompted by THE DECODER

Encyclopedia Britannica und seine Tochtergesellschaft Merriam-Webster haben OpenAI vor einem Bundesgericht in Manhattan verklagt.

Der Vorwurf: OpenAI habe ohne Erlaubnis fast 100.000 Artikel, Enzyklopädie-Einträge und Wörterbuch-Definitionen genutzt, um seine KI-Modelle zu trainieren, berichtet Reuters. Laut der Klage erzeuge ChatGPT teils nahezu wörtliche Kopien von Britannica-Inhalten und ziehe so Nutzer von Britannicas Webseiten ab.

Zudem wirft Britannica OpenAI Markenverletzungen vor: ChatGPT erwecke fälschlicherweise den Eindruck, Britannica habe der Nutzung zugestimmt, und nenne Britannica in fehlerhaften KI-Antworten als Quelle. Britannica fordert Schadensersatz und eine gerichtliche Unterlassungsanordnung.

In der Klageschrift heißt es, GPT-4 habe einen Großteil der urheberrechtlich geschützten Britannica-Inhalte "auswendig gelernt" und gebe auf Anfrage nahezu wortgleiche Kopien ganzer Abschnitte aus.

Anzeige
DEC_D_Incontent-1

GPT-4 itself has “memorized” much of Britannica’s copyrighted content and will output near-verbatim copies of significant portions on demand. The memorized examples are unauthorized copies that Defendants used to train their models, including GPT-4.

Auszug Klageschrift

Gespeichert oder nicht gespeichert, das ist vor Gericht die Frage

Ob KI-Modelle urheberrechtlich geschützte Werke in ihren Parametern speichern und damit kopieren, bewerten Gerichte derzeit völlig unterschiedlich. Das Münchner Landgericht entschied im Fall GEMA gegen OpenAI, dass Songtexte in den Modellgewichten von GPT-4 und GPT-4o enthalten seien – und dass dies als urheberrechtsrelevante Vervielfältigung gelte.

Modellgewichte sind die Zahlenwerte, die ein KI-Modell beim Training lernt und die bestimmen, welche Ausgaben es erzeugt. Für das Münchner Gericht reichte es aus, dass ein Werk anhand dieser Parameter im KI-Modell-Output reproduziert werden kann, um Unterlassungs- und Schadensersatzansprüche zu begründen.

Der britische High Court kam im Fall Getty Images gegen Stability AI zum gegenteiligen Ergebnis: Ein KI-Modell sei keine "rechtsverletzende Kopie", weil seine Gewichte urheberrechtlich geschützte Werke weder enthielten noch wiedergäben. Die Gewichte speicherten lediglich erlernte Muster, keine konkreten Werke.

Anzeige
DEC_D_Incontent-2

Eine Studie von Forschern der Universitäten Stanford und Yale zeigt unterdessen, wie konkret das Problem ist: Die Forscher konnten aus führenden KI-Modellen ganze Bücher nahezu wortgleich extrahieren.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: Klageschrift | Reuters