Autoren klagen gegen OpenAI, weil ihre urheberrechtlich geschützten Werke ohne ihre Zustimmung Teil des Trainingsmaterials für GPT-Modelle geworden sind. Das Unternehmen bestreitet die Vorwürfe in allen Punkten, scheint aber dennoch eine grundsätzliche Klärung vor Gericht anzustreben.
Anfang Juli wurde bekannt, dass die Komikerin Sarah Silverman sowie die Autoren Chris Golden und Richard Kadrey Klage gegen OpenAI eingereicht haben, weil ihre Werke vermutlich Teil des Trainingsmaterials für OpenAIs KI-Modelle geworden sind. Die Vorwürfe lauten
- unmittelbare Urheberrechtsverletzung
- indirekte Urheberrechtsverletzung
- Entfernung von Copyright-Management-Informationen (DMCA)
- unlauterer Wettbewerb
- ungerechtfertigte Bereicherung
- und Fahrlässigkeit.
OpenAI bestreitet nicht (bestätigt aber auch nicht), dass die Bücher der genannten Autoren für das KI-Training verwendet wurden. Dennoch beantragt OpenAI die Abweisung der Vorwürfe zwei bis sechs - nicht jedoch des ersten Vorwurfs, dazu später mehr.
OpenAI beruft sich in seiner Argumentation auf Fair Use, wonach das Urheberrecht technische Innovationen nicht behindern dürfe, und auf die Funktionsweise großer Sprachmodelle, die grundlegend neue Inhalte generieren würden, die keine spezifischen urheberrechtlich geschützten Passagen direkt aus den Trainingsdaten enthalten würden.
Große KI-Sprachmodelle seien beim Training auf große Textmengen angewiesen und nicht auf einen einzelnen, spezifischen Text.
OpenAI führt eine Reihe von Fällen an, in denen die Verwendung von urheberrechtlich geschütztem Material auf innovative und transformative Weise als nicht urheberrechtswidrig angesehen wurde.
Behauptungen, dass urheberrechtlich relevante Informationen wie der Name des Autors entfernt wurden, seien schlichtweg falsch und nicht belegt.
OpenAI will Klarheit durch Gerichtsurteil
Wie der Urheberrechtsspezialist Andres Guadamuz auf Twitter betont, fordert OpenAI trotz dieser Argumentation explizit keine Abweisung des ersten Klagepunktes, also der Klage wegen direkter Urheberrechtsverletzung.
Guadamuz nennt diesen Schritt "überraschend", vermutet aber, dass er taktischer Natur ist: Vermutlich rechne sich OpenAI Chancen auf ein Urteil aus, dass KI-Training durch Fair Use gedeckt sei.
"Das wäre groß", sagt Guadamuz, sollte die Klage wegen direkter Urheberrechtsverletzung tatsächlich vor Gericht kommen. Er räumt OpenAI gute Chancen ein, dass die anderen Anklagepunkte wie gefordert abgewiesen werden. Damit stünde die direkte Urheberrechtsverletzung im Mittelpunkt der Verhandlung.
Das Urteil könnte etwas Klarheit in die Urheberrechtsdebatte rund um Text- und Bilddaten für das KI-Training bringen, die weit über diesen Fall hinausgeht und auch andere große KI-Unternehmen wie Meta und Google betrifft.