Microsoft geht bei der Nutzung urheberrechtlich geschützter Bücher neue Wege und bietet HarperCollins-Autoren eine Vergütung an. Der Deal wirft Fragen nach dem Wert kreativer Arbeit im KI-Zeitalter auf.
Microsoft hat dem Verlag HarperCollins ein Angebot für die Lizenzierung von Büchern zum Training seiner KI-Modelle unterbreitet. Laut Verlagsangaben sollen Autoren 2.500 US-Dollar pro Buch erhalten, die Hälfte der von Microsoft gezahlten 5.000 US-Dollar Lizenzgebühr.
Auch die Journalistin Alice Robb, die für Bloomberg über den Deal berichtet, erhielt von ihrem Verlag ein entsprechendes Angebot für ihr 2018 erschienenes Buch "Why We Dream".
Die erteilte Trainingslizenz ist auf drei Jahre begrenzt, und Autoren können selbst entscheiden, ob sie ihre Werke für das KI-Training freigeben möchten. Allerdings können Autoren den Wert dieser Vergütung nicht einschätzen.
"Mein erster Impuls war, die Entscheidung an meinen Agenten auszulagern, aber sie lehnte ab", schreibt Robb. Es gebe keinen Präzedenzfall für diese Art von Vertrag und auch keinen Spielraum für Verhandlungen. Robb hatte eine Woche Zeit, sich zu entscheiden.
Das fiel ihr laut eigenen Angaben nicht leicht, aber letztlich entschied sie sich für das Angebot. "Ich weiß nicht, ob es die richtige Entscheidung war", resümiert sie. "Soweit ich das beurteilen kann, weiß das auch sonst niemand." Ohnehin wurde ihr acht Jahre altes Buch bereits ungefragt für das KI-Training verwendet - höchstwahrscheinlich auch von Microsoft oder dessen Partner OpenAI.
Die prekäre finanzielle Situation vieler Autoren erschwere die Entscheidung zusätzlich, schreibt Robb. Nach Angaben der Authors Guild liegt das mittlere Jahreseinkommen von Vollzeit-Autoren bei nur 20.000 US-Dollar. In Großbritannien verdienen professionelle Autoren im Median sogar nur 7.000 Pfund (circa 8.400 Euro) pro Jahr.
Microsoft will Preise für Trainingsdaten strategisch setzen
Die Ökonomin Emily Oster von der Brown University sieht in Microsofts Vorgehen eine kalkulierte Strategie: "Sie versuchen, einen Standardpreis von 5.000 Dollar für KI-Trainingsrechte zu etablieren - nicht über Bestseller, sondern über die Backlist, wo Autoren kaum noch Tantiemen erhalten, und bieten ihnen 'freies Geld' an."
Während Microsoft nun aktiv Lizenzen erwirbt, haben sich andere Technologiekonzerne bisher auf das Argument des "Fair Use" gestützt, um urheberrechtlich geschützte Werke ohne Vergütung für das KI-Training zu nutzen. Die These lautet, dass die transformative Nutzung von Daten für ein neues Produkt das Urheberrecht aushebelt. Zahlreiche Klagen von Autoren, Verlagen und Künstlern, die dies anders sehen, sind anhängig.
Wie rücksichtslos KI-Labore bisher bei der Datensammlung vorgingen, zeigte sich kürzlich bei Meta. Durch ein Gerichtsverfahren wurde bekannt, dass der Technologiekonzern gezielt Piraterienetzwerke nutzte, um urheberrechtlich geschützte Bücher für das KI-Training herunterzuladen - trotz interner Warnungen. Das Unternehmen entfernte systematisch alle Urheberrechtsvermerke aus den Werken.
Die Tatsache, dass Microsoft oder auch OpenAI vermehrt solche Lizenzdeals abschließen, ist ein Indiz dafür, dass die großen KI-Labore einlenken und wohl nicht felsenfest davon überzeugt sind, dass die unautorisierte Nutzung urheberrechtlich geschützter Inhalte für das KI-Training uneingeschränkt rechtlich anerkannt wird. Sonst würden sie sich nicht auf solche Deals einlassen. Auch bei YouTube kaufen KI-Labore Videomaterial aus der zweiten Reihe.