Die ungeklärte Urheberrechtsfrage bei KI schwelt weiter und zieht die nächste Sammelklage nach sich. Diesmal stehen auch Bloomberg und Eleuther AI im Kreuzfeuer.
Mike Huckabee, ehemaliger Gouverneur von Arkansas, und die Bestsellerautorin Lysa TerKeurst gehören zu den Autoren, die Klage gegen Meta, Microsoft und Bloomberg eingereicht haben. Sie werfen den Unternehmen vor, ihre Werke ohne ihre Zustimmung für das KI-Training verwendet und sich damit unrechtmäßig einen enormen Wert angeeignet zu haben.
Books3-Datensatz soll raubkopierte Bücher enthalten
Im Mittelpunkt der neuen Klage steht der Datensatz "Books3". Die Kläger behaupten, dass dieser Hunderttausende illegal kopierte Bücher enthält. Sie sollen von den genannten Unternehmen zum Training ihrer großen Sprachmodelle verwendet worden sein.
Microsoft und Meta haben den neuen Rechtsstreit bisher nicht kommentiert. Ein Sprecher von Bloomberg sagt, Books3 sei nicht für das Training der kommerziellen Version von BloombergGPT verwendet worden, sondern nur für das Forschungsmodell.
Angeklagt ist auch die KI-Forschungsorganisation EleutherAI, die den Datensatz "Books3" in den großen KI-Trainingsdatensatz "The Pile" aufgenommen hat. Der Books-Datensatz soll rund 183.000 gestohlene Bücher enthalten, die in den vergangenen 20 Jahren veröffentlicht wurden, und 12 Prozent des gesamten "The Pile"-Datensatzes ausmachen.
Die Autoren fordern in ihrer Klage einen nicht näher bezifferten Schadenersatz und eine einstweilige Verfügung, die den Missbrauch ihrer Werke unterbinden soll. Der Anwalt der Autoren wirft den Unternehmen vor, große Sprachmodelle "mit allen Mitteln entwickelt zu haben, einschließlich des Diebstahls der Bücher unserer Autoren."
Eine von vielen Autoren-Klagen
Zuvor hatte bereits die US-Organisation Authors Guild bekannt gegeben, dass 17 prominente Autoren, darunter John Grisham, George R.R. Martin und Jodi Picoult, unter anderem OpenAI wegen Urheberrechtsverletzung verklagt haben. Eine Gruppe von Autoren um den Pulitzer-Preisträger Michael Chabon hat beim Bundesgericht in San Francisco Klagen gegen Meta und OpenAI mit fast identischen Vorwürfen eingereicht.
Die Autoren beschuldigen unter anderem OpenAI, urheberrechtlich geschützte Bücher ohne Erlaubnis für das Training von KI verwendet zu haben, insbesondere im Rahmen des Books2-Datensatzes.
Selbst wenn diese Vorwürfe zutreffen, bleibt die Frage offen, ob diese Nutzung als "fair use" angesehen werden kann. Der Rechtsstreit könnte sich über Jahre hinziehen, während die führenden KI-Unternehmen weiterhin große KI-Modelle trainieren und möglicherweise aus Fehlern bei der Auswahl von Trainingsdaten für frühere Modelle lernen.
Microsoft und Google bieten ihren Kunden generativer KI-Produkte inzwischen eine Art Rechtsschutz. Sofern ihre Systeme bestimmungsgemäß eingesetzt werden, wollen die Konzerne im Falle von Urheberrechtsklagen gegen Kunden die Prozesskosten übernehmen.
Star-Autor Stephen King bleibt gelassen
Der Horror-Autor Stephen King hat sich kürzlich zu Bedenken über KI-Kreativität und Urheberrechtsverletzungen geäußert und erklärt, dass er sich derzeit nicht von KI-generierten Texten bedroht fühlt.
King ist überzeugt, dass KI-generierte Texte derzeit nicht besser als die Summe ihres Trainingsmaterials und Maschinen bislang nicht in der Lage sind, echte kreative Momente zu erzeugen, da ihnen die emotionale Fähigkeit dazu fehle. Das könne sich aber ändern, so King.
Dennoch will er seine Bücher nicht aus den KI-Trainingsdatensätzen entfernen. Das wäre so, als würde ein Arbeiter versuchen, den industriellen Fortschritt aufzuhalten, indem er einen mechanischen Webstuhl zerstört, schreibt King.