Google DeepMind veröffentlicht KI-Texterkennung für Gemini als Open Source
Kurz & Knapp
- Google DeepMind hat sein KI-Wasserzeichen SynthID für Text erweitert und in die Gemini-Modelle integriert. Die Technologie wird als Open-Source-Projekt veröffentlicht, um die Erkennung von KI-generiertem Text zu erleichtern.
- SynthID for Text basiert auf einem Prozess, der die Wahrscheinlichkeitswerte der vorhergesagten Tokens während der Textgenerierung von Large Language Models leicht anpasst, ohne die Qualität, Genauigkeit und Kreativität des Outputs zu beeinträchtigen. Das resultierende Muster der angepassten Wahrscheinlichkeitswerte bildet das eigentliche Wasserzeichen.
- Die Technologie funktioniert gut über mehrere Sprachen hinweg, hat aber noch Schwächen, wenn der KI-Text bearbeitet wird. Google DeepMind stellt SynthID auch über Kooperationen mit Hugging Face und im Responsible Generative AI Toolkit zur Verfügung.
Google DeepMind erweitert sein KI-Wasserzeichen SynthID für Text und integriert es in die Gemini-Modelle. Die Technologie wird als Open-Source-Projekt veröffentlicht und soll die Erkennung von KI-generierten Inhalten erleichtern.
SynthID für Text basiert auf einem komplexen Prozess, der in die Textgenerierung von Large Language Models (LLMs) eingreift. Ein Large Language Model erzeuge Text Token für Token, wobei diese Token einzelne Zeichen, Wörter oder Teile von Sätzen repräsentieren könnten.
Bei der Erstellung einer Textsequenz sagt das Modell das jeweils wahrscheinlichste nächste Token voraus. Diese Vorhersagen basieren auf den vorhergehenden Wörtern und Wahrscheinlichkeitsscores für potenzielle Tokens.
Subtile Anpassung der Wahrscheinlichkeitsscores
Hier kommt SynthID ins Spiel: Das Tool passt die Wahrscheinlichkeitswerte der vorhergesagten Tokens geringfügig an - allerdings nur in Fällen, in denen dies die Qualität, Genauigkeit und Kreativität des Outputs nicht beeinträchtigt.
Google DeepMind erklärt weiter, dass dieser Prozess für den gesamten generierten Text wiederholt wird. Ein einzelner Satz könne so zehn oder mehr angepasste Wahrscheinlichkeitsscores enthalten, eine ganze Seite sogar Hunderte.
Das endgültige Muster der Scores - sowohl für die Wortwahl des Modells als auch für die angepassten Wahrscheinlichkeiten - bildet das eigentliche Wasserzeichen.
Googles SynthID für Text manipuliert die Vorhersagewahrscheinlichkeiten für Tokens, um ein KI-Text-Wasserzeichen zu erzeugen. | Video: Google Depemind
Laut Google DeepMind kann diese Technik bereits auf drei Sätze angewendet werden. Mit zunehmender Textlänge steigt die Robustheit und Genauigkeit von SynthID. Das Verfahren funktioniert sprachübergreifend gut, hat aber Schwächen bei bearbeitetem Text.
Die Methode soll besser funktionieren als existierende Textwasserzeichen-Systeme. Eine detaillierte Beschreibung hat Google Deepmind in der Wissenschaftszeitschrift Nature veröffentlicht.
Integration in Gemini und Open-Source-Veröffentlichung
Google DeepMind hat SynthID in die Gemini-App und -Website integriert, um generierte Texte mit Wasserzeichen zu versehen und zu identifizieren. Darüber hinaus steht die Technologie als Open-Source-Projekt bei Github, im Google Responsible Generative AI Toolkit und bei Hugging Face zur Verfügung, mit dem Ziel, dass mehr Menschen die Textausgaben ihrer eigenen LLMs mit Wasserzeichen versehen.
Google Deepmind hatte SynthID zuvor schon für Bilder und für Stimmen sowie für Musik vorgestellt.
KI-News ohne Hype
Von Menschen kuratiert.
- Mehr als 20 Prozent Launch-Rabatt.
- Lesen ohne Ablenkung – keine Google-Werbebanner.
- Zugang zum Kommentarsystem und Austausch mit der Community.
- Wöchentlicher KI-Newsletter.
- 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
- Bis zu 25 % Rabatt auf KI Pro Online-Events.
- Zugang zum kompletten Archiv der letzten zehn Jahre.
- Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.