KI in der Praxis

KI braucht endlich eine gerichtliche Klärung zur fairen Nutzung von Trainingsdaten

Matthias Bastian

Midjourney prompted by THE DECODER

US-Gerichte geraten zunehmend unter Druck, grundlegende Urteile über die Verwendung urheberrechtlich geschützter Daten für das Training generativer KI zu fällen.

Eine Gruppe von Autoren um den Pulitzer-Preisträger Michael Chabon hat beim Bundesgericht in San Francisco Klagen gegen Meta und OpenAI eingereicht.

Die Vorwürfe sind dieselben wie in den bereits anhängigen Klagen: direkte und indirekte Urheberrechtsverletzung, Entfernung von Urheberrechtsinformationen, unlauterer Wettbewerb und Fahrlässigkeit.

Die Autoren gehen davon aus, dass ihre urheberrechtlich geschützten Werke unberechtigterweise Teil des Trainingsmaterials der jeweiligen KI-Systeme geworden sind, konkret im sogenannten Book-Datensatz.

Dafür gibt es laut Anklageschrift keine Beweise, aber Informationen und Vermutungen. Als Indiz führen die Ankläger an, dass ChatGPT in der Lage sei, detaillierte Zusammenfassungen der Bücher zu schreiben.

Diese Zusammenfassungen könnten jedoch auch auf Zusammenfassungen aus dem Internet basieren und würden nicht notwendigerweise bedeuten, dass das System mit dem kompletten Buch trainiert wurde.

OpenAI sucht Fair-Use-Klärung vor Gericht

In einer Antwort auf eine fast identische Klage bestritt OpenAI nicht, dass die Bücher der beschwerdeführenden Autoren Teil des Trainingsmaterials waren (bestätigte dies aber auch nicht). Stattdessen berief sich das Unternehmen auf eine faire Nutzung der Daten für eine neue Entwicklung, die auch ohne Zustimmung der Autorinnen und Autoren urheberrechtskonform sein könne.

OpenAI bestritt jedoch eine Reihe von Nebenforderungen, wie z.B. die Behauptung, dass Urheberrechtsvermerke entfernt worden seien, vermutlich in der Absicht, vor Gericht zu ziehen und eine Klärung der grundlegendsten Frage zu erreichen, die ähnliche KI-Rechtsstreitigkeiten obsolet machen könnte: Ist die Verwendung urheberrechtlich geschützter Werke für das Training künstlicher Intelligenz eine faire Nutzung?

Mit diesen Klagen gegen Meta, OpenAI und auch Google und ähnlichen offenen Fragen im Kontext der Verwendung von Code und Bildern für das KI-Training ist klar, dass die KI-Branche nicht zur Ruhe kommen wird, bis in dieser Sache ein grundlegendes Gerichtsurteil ergangen ist.

Um Sicherheit zu vermitteln, bietet Microsoft seinen Kunden sogar an, eventuelle Gerichtskosten zu übernehmen, falls es aufgrund der generativen KI-Angebote von Microsoft zu einer Klage kommen sollte.