Inhalt
summary Zusammenfassung

Google DeepMind erweitert sein KI-Wasserzeichen SynthID für Text und integriert es in die Gemini-Modelle. Die Technologie wird als Open-Source-Projekt veröffentlicht und soll die Erkennung von KI-generierten Inhalten erleichtern.

Anzeige

SynthID für Text basiert auf einem komplexen Prozess, der in die Textgenerierung von Large Language Models (LLMs) eingreift. Ein Large Language Model erzeuge Text Token für Token, wobei diese Token einzelne Zeichen, Wörter oder Teile von Sätzen repräsentieren könnten.

Bei der Erstellung einer Textsequenz sagt das Modell das jeweils wahrscheinlichste nächste Token voraus. Diese Vorhersagen basieren auf den vorhergehenden Wörtern und Wahrscheinlichkeitsscores für potenzielle Tokens.

Subtile Anpassung der Wahrscheinlichkeitsscores

Hier kommt SynthID ins Spiel: Das Tool passt die Wahrscheinlichkeitswerte der vorhergesagten Tokens geringfügig an - allerdings nur in Fällen, in denen dies die Qualität, Genauigkeit und Kreativität des Outputs nicht beeinträchtigt.

Anzeige
Anzeige

Google DeepMind erklärt weiter, dass dieser Prozess für den gesamten generierten Text wiederholt wird. Ein einzelner Satz könne so zehn oder mehr angepasste Wahrscheinlichkeitsscores enthalten, eine ganze Seite sogar Hunderte.

Das endgültige Muster der Scores - sowohl für die Wortwahl des Modells als auch für die angepassten Wahrscheinlichkeiten - bildet das eigentliche Wasserzeichen.

Googles SynthID für Text manipuliert die Vorhersagewahrscheinlichkeiten für Tokens, um ein KI-Text-Wasserzeichen zu erzeugen. | Video: Google Depemind

Laut Google DeepMind kann diese Technik bereits auf drei Sätze angewendet werden. Mit zunehmender Textlänge steigt die Robustheit und Genauigkeit von SynthID. Das Verfahren funktioniert sprachübergreifend gut, hat aber Schwächen bei bearbeitetem Text.

Die Methode soll besser funktionieren als existierende Textwasserzeichen-Systeme. Eine detaillierte Beschreibung hat Google Deepmind in der Wissenschaftszeitschrift Nature veröffentlicht.

Empfehlung

Integration in Gemini und Open-Source-Veröffentlichung

Google DeepMind hat SynthID in die Gemini-App und -Website integriert, um generierte Texte mit Wasserzeichen zu versehen und zu identifizieren. Darüber hinaus steht die Technologie als Open-Source-Projekt bei Github, im Google Responsible Generative AI Toolkit und bei Hugging Face zur Verfügung, mit dem Ziel, dass mehr Menschen die Textausgaben ihrer eigenen LLMs mit Wasserzeichen versehen.

Google Deepmind hatte SynthID zuvor schon für Bilder und für Stimmen sowie für Musik vorgestellt.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Google DeepMind hat sein KI-Wasserzeichen SynthID für Text erweitert und in die Gemini-Modelle integriert. Die Technologie wird als Open-Source-Projekt veröffentlicht, um die Erkennung von KI-generiertem Text zu erleichtern.
  • SynthID for Text basiert auf einem Prozess, der die Wahrscheinlichkeitswerte der vorhergesagten Tokens während der Textgenerierung von Large Language Models leicht anpasst, ohne die Qualität, Genauigkeit und Kreativität des Outputs zu beeinträchtigen. Das resultierende Muster der angepassten Wahrscheinlichkeitswerte bildet das eigentliche Wasserzeichen.
  • Die Technologie funktioniert gut über mehrere Sprachen hinweg, hat aber noch Schwächen, wenn der KI-Text bearbeitet wird. Google DeepMind stellt SynthID auch über Kooperationen mit Hugging Face und im Responsible Generative AI Toolkit zur Verfügung.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!