Inhalt
summary Zusammenfassung

Ein US-Bundesgericht hat entschieden, dass das Training von KI-Systemen mit urheberrechtlich geschütztem Material nicht unter "Fair Use" fällt. Das Urteil betrifft jedoch nur nicht-generative KI und könnte für OpenAI und Co. weniger relevant sein.

Anzeige

Ein US-Bundesgericht hat in einem Urteil die Fair-Use-Verteidigung des KI-Unternehmens Ross Intelligence zurückgewiesen. Das Gericht entschied, dass die Nutzung von urheberrechtlich geschütztem Material zum Training einer KI in diesem Fall nicht durch die Fair-Use-Doktrin gedeckt ist.

Der Fall dreht sich um etwa 25.000 juristische Zusammenfassungen, die Ross Intelligence aus der Westlaw-Datenbank von Thomson Reuters über Umwege erworben hatte. In einem Zwischenschritt wandelte Ross die Kopfnoten in numerische Daten über die Beziehungen zwischen juristischen Wörtern um, um sie in seine KI einzuspeisen und so die Funktion des eigenen Tools zu verbessern.

In einem Zwischenschritt wandelte Ross die Kopfnoten in numerische Daten über die Beziehungen zwischen juristischen Wörtern um, um sie in sein KI-Modell einzuspeisen und so die Funktion des eigenen Tools zu verbessern.

Anzeige
Anzeige

Das Gericht stützte sich bei der Bewertung auf die vier klassischen Fair-Use-Faktoren – Zweck und Charakter der Nutzung, Art des urheberrechtlich geschützten Werks, Umfang und Bedeutung des verwendeten Teils im Verhältnis zum Ganzen und Auswirkungen der Nutzung auf den potenziellen Markt oder Wert des urheberrechtlich geschützten Werks – und lehnte Ross' Argumentation vollständig ab.

Besonders der kommerzielle Charakter der Nutzung und die fehlende "Transformativität" sprachen gegen Fair Use. Ross hatte das Material nicht kreativ umgewandelt, sondern lediglich als Trainingsgrundlage für ein Konkurrenzprodukt verwendet, das wie das System von Thomson Reuters bestehende Gerichtsurteile zurückgibt.

Urteil gilt nicht für große Sprachmodelle von OpenAI und Co.

Das Gericht betont ausdrücklich, dass die Entscheidung nur für nicht-generative KI gilt. Anders als Sprachmodelle, die aus bestehenden Inhalten lernen, neue Inhalte zu generieren, stellt Ross' System eine direkte kommerzielle Konkurrenz zu dem Produkt von Thomson Reuters dar.

Genau das ist aber die Fair-Use-Argumentation von OpenAI und Co.: KI-Trainingsdaten seien nur dazu da, eine allgemeine Fähigkeit wie das Verstehen von Text zu erlernen, nicht aber, um die Daten selbst zu nutzen oder gar ein Konkurrenzprodukt zu entwickeln, das ähnliche Daten ausgibt.

Textauszug aus Gerichtsurteil: Ross vs. Thomson Reuters zur nicht-transformativen Nutzung von Headnotes durch Ross's KI-System für Rechtsrecherche.
Das Gericht stellt klar: Ross' KI-System ist keine generative KI, sondern reorganisiert lediglich existierende Inhalte. Diese Unterscheidung war zentral für die Ablehnung der Fair-Use-Verteidigung im Urheberrechtsstreit mit Thomson Reuters. | Bild: Screenshot via Courtlistener

Auch die Auswirkungen auf den Markt spielten bei dem Urteil eine wichtige Rolle. Das Gericht sah sowohl den bestehenden Markt für Rechtsrecherche als auch einen potenziellen Markt für KI-Trainingsdaten durch die Handlungen von Ross Intelligence gefährdet.

Empfehlung

Die Erwägung eines möglichen Marktes für KI-Trainingsdaten könnte wiederum auch Hersteller generativer KI-Systeme betreffen, die teilweise bereits Trainingsdaten einkaufen und damit über Fair Use hinaus einen kommerziellen Wert einräumen. Die Beweislast dafür, dass solch ein Markt nicht existiert und daher nicht betroffen wären, liege bei Ross, heißt es im Urteil.

Differenzierte Rechtsprechung zeichnet sich ab

Das Urteil deutet darauf hin, dass die Gerichte bei der Beurteilung solcher Rechtsfälle differenziert vorgehen. Eine abschließende Klärung der Frage der fairen Nutzung von Trainingsdaten für generative KI-Systeme ist damit keinesfalls erreicht und auch nicht in absehbarer Zeit zu erwarten.

Stattdessen dürfte es weiter eine Reihe von Präzedenzfällen für unterschiedliche Systeme in verschiedenen Nutzungskontexten geben. Im Falle des Urteils oben waren es recht eindeutig zwei konkurrierende Angebote. Aber ist ein Chatbot eine Konkurrenz zu einer Nachrichten-Seite? Ist ein Musik-Generator Wettbewerb für Musiker? Diese Fragen sind weitaus diffiziler.

Ein Beispiel: Erst kürzlich wurde eine Klage der Nachrichtenseiten Raw Story und AlterNet gegen OpenAI abgewiesen. Die Richterin folgte dabei der Fair-Use-Argumentation von OpenAI und Co.: ChatGPT synthetisiere lediglich KI-Antworten auf Basis der trainierten Inhalte, die Wahrscheinlichkeit einer exakten Kopie eines Artikels aus dem Trainingsmaterial sei gering und Fakten seien nicht urheberrechtlich geschützt.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Ross Intelligence musste bereits 2021 aufgeben. Zwar bezeichnete Ross die Klage als "unbegründet", konnte aber nach eigenen Angaben während des Rechtsstreits nicht genügend Finanzmittel aufbringen, um den Betrieb fortzuführen.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Ein US-Bundesgericht hat entschieden, dass die Nutzung urheberrechtlich geschützter Daten durch Ross Intelligence zum Training einer Rechtsrecherche-KI nicht unter die Fair-Use-Doktrin fällt.
  • Das Urteil stützt sich auf die kommerziellen Absichten von Ross und die fehlende Transformativität der Daten-Nutzung. Es gilt explizit nicht für generative KI-Systeme wie große Sprachmodelle, die aus Trainingsdaten lernen, neue Inhalte zu erstellen.
  • Die differenzierte Rechtsprechung deutet darauf hin, dass es bald keine abschließende Klärung der Frage der fairen Nutzung von Trainingsdaten für KI geben wird, sondern eine Reihe von Präzedenzfällen für unterschiedliche Systeme und Nutzungskontexte.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!