Ein New Yorker Gericht erlaubt dem Nachrichtenmagazin The Intercept, seine Klage gegen OpenAI wegen Verstößen gegen den Digital Millennium Copyright Act beim KI-Training fortzusetzen.
Wie aus einer Anordnung von Richter Jed S. Rakoff vom U.S. District Court for the Southern District of New York hervorgeht, darf The Intercept seine Klage gegen OpenAI in Teilen fortführen. Darin argumentiert das Magazin, dass OpenAI gegen Bestimmungen des Digital Millennium Copyright Act (DMCA) verstoßen habe.
The Intercept: OpenAI hat Copyright-Informationen entfernt
Konkret wirft The Intercept OpenAI vor, beim Erstellen der Trainingsdaten für ChatGPT unerlaubt sogenannte "Copyright-Management-Informationen" wie Titel und Autorennamen von verwendeten Nachrichtenartikeln entfernt zu haben. Solche Informationen dienen dazu, die Urheberschaft und den Rechtestatus eines Werks zu dokumentieren.
Die Entfernung dieser Daten verstoße gegen eine Bestimmung des Digital Millennium Copyright Act (DMCA), einem US-Gesetz von 1998, das den Umgang mit Urheberrechten im digitalen Zeitalter regelt. The Intercept sieht darin eine Verletzung seiner Rechte als Urheber der Artikel.
The Intercept hatte die Klage im Februar eingereicht und sich damit einer wachsenden Zahl von Medien angeschlossen, die OpenAI und seinem Investor Microsoft verschiedene Urheberrechtsverletzungen vorwerfen. Richter Rakoff wies zwar einen Teil der Vorwürfe zurück, darunter alle gegen Microsoft. Er erlaubte The Intercept jedoch, den Hauptvorwurf gegen OpenAI weiter zu verfolgen.
"Diese Entscheidung zeigt, dass der DMCA wichtige Schutzmaßnahmen für Nachrichtenorganisationen gegen Übergriffe durch KI-Unternehmen bietet", kommentierte der Anwalt von The Intercept, Matt Topic, die Anordnung. Es handle sich um eine "erstmalige Entscheidung" mit potenziell weitreichender Signalwirkung.
Gerichte müssen Urheberrecht im KI-Kontext neu auslegen
Die Gerichte stehen vor der Herausforderung, bestehende Urheberrechtsgesetze auf die Verwendung von geschütztem Material zum Training von KI-Systemen anzuwenden. Erst kürzlich hatte eine andere New Yorker Bundesrichterin eine ähnliche Klage der Nachrichtenseiten Raw Story und AlterNet gegen OpenAI noch komplett abgewiesen.
Auch hier ging es um einen möglichen Verstoß gegen den DMCA durch die Entfernung von Copyright-Daten. Doch Richterin Colleen McMahon machte deutlich, dass der eigentliche Schaden, für den die Kläger Entschädigung forderten, nicht der Ausschluss der Copyright-Informationen aus den Trainingsdatensätzen von OpenAI sei.
Vielmehr gehe es den Klägern darum, dass OpenAI ihre Artikel ohne Entschädigung zur Entwicklung von ChatGPT verwendet habe. Richterin McMahon befand, dass die Kläger nicht ausreichend darlegen konnten, dass ihnen durch die Nutzung ihrer Artikel als KI-Trainingsdaten ein konkreter Schaden entstanden sei.
Sie folgte auch der Argumentation von OpenAI, dass ChatGPT lediglich KI-generierte Antworten basierend auf den Trainingsinhalten produziere. Die Wahrscheinlichkeit einer exakten Kopie eines Artikels sei gering. Sollte dies doch passieren, handele es sich um einen Fehler und nicht um ein intendiertes Produktmerkmal. Zudem seien reine Fakten nicht urheberrechtlich geschützt.
Im Fall von The Intercept sah Richter Rakoff dagegen zumindest die Möglichkeit, dass der Kläger einen konkreten Schaden durch die Entfernung der Copyright-Informationen nachweisen könnte. Dies wird nun Gegenstand des weiteren Verfahrens sein.
Die ersten Urteile markieren wohl den Beginn eines längeren juristischen Ringens um die Nutzung urheberrechtlich geschützter Inhalte durch KI-Systeme. Dazu zählt etwa die Klage der New York Times gegen OpenAI, in der es ebenfalls um die nicht genehmigte Verwendung von Artikeln zum Training von KI-Modellen geht.