In den USA sammelt das US Copyright Office Meinungen zum Umgang mit Urheberrecht und Copyright für generative KI. Auch die großen KI-Unternehmen äußern sich.
Insbesondere Meta erklärt in einem ausführlichen Schreiben von Ende Oktober 2023 die Hintergründe der KI-Entwicklung und der Verwendung von Trainingsdaten. Meta argumentiert, dass die Nutzung von urheberrechtlich geschütztem Material für das Training generativer KI-Modelle keine konsumtive Nutzung sei und daher nicht gegen das Urheberrecht verstoße.
Selbst wenn die Nutzung den Urheberrechtsschutz auslöse, handele es sich um eine faire Nutzung. Das Training von KI-Modellen sei ein transformativer Prozess, bei dem statistische Informationen aus Sprache und abstrakten Konzepten extrahiert würden, um neue Inhalte zu generieren.
Das Unternehmen stellt kategorisch fest, dass KI-Modelle keine urheberrechtlich geschützten Daten speichern, sondern vielmehr Muster und Beziehungen aus den Trainingsdaten lernen und somit nicht die Rechte von Urheberrechtsinhabern verletzen.
Generative KI ist wie der Buchdruck, meint Meta
Meta weist auf verschiedene Probleme im Zusammenhang mit Vorschlägen für gesetzliche Lizenzierungsmechanismen hin und bekräftigt, dass das Urheberrecht künstlerische Stile nicht schützt und auch nicht schützen sollte.
Zwar gebe es berechtigte Bedenken, dass KI-Systeme die Stimmen, das Aussehen oder den Stil von Künstlern imitieren könnten. Dies sei jedoch nichts grundlegend Neues und werde derzeit durch das staatliche Recht auf Öffentlichkeit, das Bundesgesetz gegen unlauteren Wettbewerb und die Prinzipien des ersten Verfassungszusatzes abgedeckt. Daher seien keine drastischen Änderungen des geltenden Rechts erforderlich, um KI zu regulieren.
Darüber hinaus sei generative KI ein Werkzeug zur Steigerung der menschlichen Kreativität und Produktivität. In dieser Hinsicht unterscheide sie sich nicht von einer Druckerpresse, einer Kamera oder einem Computer.
Hohe Lizenzgelder könnten generative KI ausbremsen
Interessant ist auch, dass laut Meta die Lizenzierung von KI-Trainingsdaten im benötigten Umfang nicht bezahlbar wäre. "Tatsächlich wäre es unmöglich, einen Markt zu entwickeln, der es KI-Entwicklern erlauben würde, alle Daten zu lizenzieren, die ihre Modelle benötigen", heißt es in dem Papier.
Zwar sei es möglich, Vereinbarungen mit einzelnen Rechteinhabern zu treffen und Daten zu lizenzieren. Diese Vereinbarungen würden aber nur einen "winzigen Bruchteil" der benötigten Daten abdecken. Bei vielen Inhalten, etwa Online-Rezensionen, sei es zudem administrativ unmöglich, die Rechteinhaber ausfindig zu machen und mit ihnen Lizenzbedingungen auszuhandeln. Ähnlich argumentieren OpenAI und Google.
Google plädiert für Zurückhaltung bei neuen Urheberrechtsregeln
Google argumentiert weiter, dass die bestehenden Urheberrechtsgrundsätze flexibel genug seien, um mit KI-Szenarien umzugehen.
Das Unternehmen schlägt vor, dass die Gerichte entscheiden sollten, wie diese Grundsätze in bestimmten Fällen anzuwenden sind. Google betonte, dass ein Gleichgewicht zwischen den Interessen der Rechteinhaber und der Öffentlichkeit gefunden werden müsse.
Inhalte, die von KI ohne menschliches Zutun erzeugt werden, seien nicht urheberrechtsfähig. Die meisten generativen KI-Modelle würden jedoch menschliches Eingreifen und Kreativität erfordern. In solchen Fällen könne ein Urheberrecht gewährt werden.
Hinsichtlich der Rechtsverletzung argumentierte Google, dass ein Werk nur dann eine Rechtsverletzung darstelle, wenn es dem angeblich kopierten Werk "im Wesentlichen ähnlich" sei. Dies sei bei generativer KI zwar nicht ausgeschlossen, aber unwahrscheinlich.
Google betont, dass verfrühte gesetzgeberische Maßnahmen mehr Schaden als Nutzen anrichten könnten. Sie würden Innovationen behindern und die Möglichkeiten der KI-Technologie einschränken.
Die Systeme befänden sich noch in einem frühen Entwicklungsstadium und benötigten eine flexible Auslegung der fairen Nutzung, um die neuen Möglichkeiten für Urheber, Verbraucher und die Gesellschaft nicht einzuschränken. Die bestehenden Regeln seien ausreichend, um den Herausforderungen zu begegnen.
Google weist auch auf neu eingeführte Webkontrollen hin, mit denen Content Publisher festlegen können, ob Trainingsdaten-Crawler ihre Inhalte lesen und verwenden dürfen. Dies ist jedoch nur für zukünftige KI-Modelle relevant.
OpenAI beruft sich auch auf Fair Use
OpenAI argumentiert auch, dass generative KI kein urheberrechtlich geschütztes Material wiedergibt und dass die explizite Erwähnung und Wiedergabe von urheberrechtlich geschütztem Material selten ist.
Wie Google und Meta beruft sich auch OpenAI auf Fair Use, da das Training von KI-Modellen eine transformative Nutzung von Daten darstelle.
Wenn ein Modell mit einer großen Anzahl von Bildern konfrontiert wird, die mit dem Wort "Tasse" beschriftet sind, lernt es wie ein menschliches Kind, welche visuellen Elemente das Konzept "Tasse" ausmachen, schreibt OpenAI.
Das geschehe nicht durch den Aufbau einer internen Datenbank mit Trainingsbildern, sondern durch die Abstraktion der faktischen Metadaten, die mit dem Begriff "Tasse" verbunden sind.
Auf diese Weise könne das Modell sogar Konzepte kombinieren und ein neues, völlig originelles Bild einer "Kaffeetasse" oder sogar einer "Kaffeetasse, die auch ein Portal zu einer anderen Dimension ist" erzeugen.
Ferner sei es möglich, den ChatGPT-Crawler zu blockieren, sodass die eigenen Daten nicht in den Trainingsdatensätzen landen. Ähnlich wie bei Google gilt hier: Diese Möglichkeit wirkt sich frühestens auf zukünftige Modelle aus, denn sie besteht erst seit kurzer Zeit. Für aktuelle Modelle und bestehende Datensätze macht sie keinen Unterschied.
OpenAI fordert das Copyright Office auf, bei der Forderung nach neuen rechtlichen Lösungen vorsichtig zu sein, da sich die Technologie schnell weiterentwickelt und die Gerichte noch keine Gelegenheit hatten, über die meisten der vom Copyright Office aufgeworfenen Fragen zu entscheiden.
Apple hält generativen KI-Code für urheberrechtsfähig
Apple hat das kürzeste Schreiben der großen KI-Unternehmen eingereicht und bezieht sich speziell auf die Verwendung von generativer KI für Programmcode im Kontext der Frage, ob ein Mensch, der ein generatives KI-System verwendet, als "Urheber" des von dem KI-System erzeugten Materials angesehen werden sollte.
Die Automatisierung der Entwicklung von Computerprogrammen sei keine neue Entwicklung, und KI-Codierungswerkzeuge stellten eine bedeutende Weiterentwicklung dieses Prozesses dar, schreibt Apple.
Wenn der menschliche Entwickler die Werkzeuge kontrolliert, den vorgeschlagenen Code überprüft und die Form bestimmt, in der er verwendet werden soll, einschließlich der Konvertierungen, weise der letztlich erstellte Code eine hinreichende menschliche Urheberschaft auf, um urheberrechtlich geschützt werden zu können. Dies gelte unabhängig davon, ob es sich bei dem Werkzeug um ein generatives KI-Werkzeug oder um ein herkömmliches, nicht KI-gestütztes Werkzeug handele.
Unternehmen wie Apple, die ihre Entwickler mit generativen KI-Werkzeugen arbeiten lassen, haben naturgemäß ein großes Interesse daran, dass der Code ihrer Software urheberrechtlich geschützt werden kann und nicht von anderen Unternehmen verwendet werden darf.