Google DeepMind erweitert sein KI-Wasserzeichen SynthID für Text und integriert es in die Gemini-Modelle. Die Technologie wird als Open-Source-Projekt veröffentlicht und soll die Erkennung von KI-generierten Inhalten erleichtern.
SynthID für Text basiert auf einem komplexen Prozess, der in die Textgenerierung von Large Language Models (LLMs) eingreift. Ein Large Language Model erzeuge Text Token für Token, wobei diese Token einzelne Zeichen, Wörter oder Teile von Sätzen repräsentieren könnten.
Bei der Erstellung einer Textsequenz sagt das Modell das jeweils wahrscheinlichste nächste Token voraus. Diese Vorhersagen basieren auf den vorhergehenden Wörtern und Wahrscheinlichkeitsscores für potenzielle Tokens.
Subtile Anpassung der Wahrscheinlichkeitsscores
Hier kommt SynthID ins Spiel: Das Tool passt die Wahrscheinlichkeitswerte der vorhergesagten Tokens geringfügig an - allerdings nur in Fällen, in denen dies die Qualität, Genauigkeit und Kreativität des Outputs nicht beeinträchtigt.
Google DeepMind erklärt weiter, dass dieser Prozess für den gesamten generierten Text wiederholt wird. Ein einzelner Satz könne so zehn oder mehr angepasste Wahrscheinlichkeitsscores enthalten, eine ganze Seite sogar Hunderte.
Das endgültige Muster der Scores - sowohl für die Wortwahl des Modells als auch für die angepassten Wahrscheinlichkeiten - bildet das eigentliche Wasserzeichen.
Laut Google DeepMind kann diese Technik bereits auf drei Sätze angewendet werden. Mit zunehmender Textlänge steigt die Robustheit und Genauigkeit von SynthID. Das Verfahren funktioniert sprachübergreifend gut, hat aber Schwächen bei bearbeitetem Text.
Die Methode soll besser funktionieren als existierende Textwasserzeichen-Systeme. Eine detaillierte Beschreibung hat Google Deepmind in der Wissenschaftszeitschrift Nature veröffentlicht.
Integration in Gemini und Open-Source-Veröffentlichung
Google DeepMind hat SynthID in die Gemini-App und -Website integriert, um generierte Texte mit Wasserzeichen zu versehen und zu identifizieren. Darüber hinaus steht die Technologie als Open-Source-Projekt bei Github, im Google Responsible Generative AI Toolkit und bei Hugging Face zur Verfügung, mit dem Ziel, dass mehr Menschen die Textausgaben ihrer eigenen LLMs mit Wasserzeichen versehen.
Google Deepmind hatte SynthID zuvor schon für Bilder und für Stimmen sowie für Musik vorgestellt.