OpenAI, Google und Microsoft diskutieren mit führenden Verlagen über Journalismus im Zeitalter der generativen KI. Die größte Baustelle ist das Urheberrecht.
Führende Tech-Unternehmen sprechen mit großen Verlagen über die Nutzung von Nachrichteninhalten für das Training von KI-Modellen und die Verwendung der Inhalte in Chatbots. So sollen News Corp, Axel Springer, The New York Times und The Guardian mit mindestens einem der führenden KI-Unternehmen gesprochen haben.
Die Tech-Unternehmen sollen bereit sein, Millionenbeträge zu zahlen und an langfristigen Beziehungen interessiert sein. Darüber hinaus sind einige der Tech-Unternehmen in Gesprächen darüber, wie Verlage mit KI ihre Umsätze steigern können.
Verhandlungen sind noch in einer frühen Phase
Die Gespräche sollen sich noch in einer frühen Phase befinden. Im Gespräch ist offenbar eine Art Content-Abonnement von KI-Unternehmen bei Verlagen, die im Gegenzug die Inhalte für ihre Technologie nutzen dürfen.
Für die urheberrechtskonforme Nutzung von Nachrichteninhalten für das KI-Training würden derzeit Summen zwischen fünf und 20 Millionen US-Dollar pro Jahr genannt. An den Verhandlungen ist auch die Financial Times beteiligt, die über die Gespräche berichtet.
Axel-Springer-Chef Mathias Döpfner schlägt laut Financial Times ein quantitatives Modell pro Abruf vor, ähnlich wie beim Musik-Streaming. Dafür müssten die KI-Unternehmen aber transparent machen, welche Inhalte sie genau nutzen. OpenAI etwa legt die Trainingsdaten für GPT-4 mit Verweis auf das Wettbewerbsumfeld nicht offen.
Ein Jahresabonnement sieht Döpfner als zweite Wahl, da es kleinere regionale und lokale Nachrichtenangebote benachteiligen würde. Er fordert eine branchenweite und gemeinschaftliche Lösung.
"Wenn es keinen Anreiz gibt, geistiges Eigentum zu schaffen, gibt es auch nichts zu crawlen", sagt Döpfner. "Und aus künstlicher Intelligenz wird künstliche Dummheit."
Google soll sich bereit erklärt haben, Nachrichteninhalte für das KI-Training zu lizenzieren, und The Guardian und NewsUK ein entsprechendes Modell vorgelegt haben. Google bestätigt die Gespräche, äußert sich aber nicht zum Inhalt.
Das Unternehmen spreche mit Nachrichtenverlagen in den USA, Großbritannien und Europa und habe bereits KI mit öffentlich zugänglichen Inhalten trainiert, darunter auch solche von Verlagen. Eine weitere Option sei, den Verlagen mehr Kontrolle über die Nutzung ihrer eigenen Inhalte zu geben, etwa durch eine Opt-Out-Option.
OpenAI CEO Sam Altman soll mit News Corp und The New York Times gesprochen haben. Bei der Vorstellung von ChatGPT mit Internetzugang räumte OpenAI ein, dass dies "eine neue Art" sei, mit dem Internet zu interagieren. Man freue sich auf Vorschläge, wie man den Datenverkehr zu den Quellen zurückführen und zur Gesundheit des Ökosystems beitragen könne.
KI-Chatbots untergraben etablierte Content-Ökosysteme
Das Urheberrecht im Zeitalter der KI ist im Verlagskontext in zweierlei Hinsicht problematisch. Zum einen sind journalistische Inhalte in den Trainingsdaten enthalten. Zum anderen greifen Chatbots, die mit dem Internet verbunden sind, in Echtzeit auf journalistische Inhalte zu und nutzen diese als Vorlage für eine generierte Antwort, etwa eine kurze Zusammenfassung einer Meldung.
Das Problem: Der Ersteller des ursprünglichen Inhalts, der Verlag, hat nichts davon. Die Nutzer des Chatbots kommen nicht auf die Website, bringen also keinen Umsatz, im schlimmsten Fall zitiert der Chatbot nicht einmal die Quelle korrekt, sodass auch das Branding auf der Strecke bleibt.
Von dieser Entwicklung sind neben Verlagen generell alle Anbieter von Inhalten betroffen. Selbst Videoinhalte und Podcasts von Diensten wie YouTube oder Spotify könnten künftig als kurze Textzusammenfassungen, Audiobeiträge oder verkürzte Videos in Chatbots landen. Nachrichten- oder Ratgeberangebote dürften von dieser Entwicklung am stärksten betroffen sein.