Google DeepMind veröffentlicht KI-Texterkennung für Gemini als Open Source

Google DeepMind erweitert sein KI-Wasserzeichen SynthID für Text und integriert es in die Gemini-Modelle. Die Technologie wird als Open-Source-Projekt veröffentlicht und soll die Erkennung von KI-generierten Inhalten erleichtern.

SynthID für Text basiert auf einem komplexen Prozess, der in die Textgenerierung von Large Language Models (LLMs) eingreift. Ein Large Language Model erzeuge Text Token für Token, wobei diese Token einzelne Zeichen, Wörter oder Teile von Sätzen repräsentieren könnten.

Bei der Erstellung einer Textsequenz sagt das Modell das jeweils wahrscheinlichste nächste Token voraus. Diese Vorhersagen basieren auf den vorhergehenden Wörtern und Wahrscheinlichkeitsscores für potenzielle Tokens.

Subtile Anpassung der Wahrscheinlichkeitsscores

Hier kommt SynthID ins Spiel: Das Tool passt die Wahrscheinlichkeitswerte der vorhergesagten Tokens geringfügig an - allerdings nur in Fällen, in denen dies die Qualität, Genauigkeit und Kreativität des Outputs nicht beeinträchtigt.

Google DeepMind erklärt weiter, dass dieser Prozess für den gesamten generierten Text wiederholt wird. Ein einzelner Satz könne so zehn oder mehr angepasste Wahrscheinlichkeitsscores enthalten, eine ganze Seite sogar Hunderte.

Das endgültige Muster der Scores - sowohl für die Wortwahl des Modells als auch für die angepassten Wahrscheinlichkeiten - bildet das eigentliche Wasserzeichen.

Googles SynthID für Text manipuliert die Vorhersagewahrscheinlichkeiten für Tokens, um ein KI-Text-Wasserzeichen zu erzeugen. | Video: Google Depemind

Laut Google DeepMind kann diese Technik bereits auf drei Sätze angewendet werden. Mit zunehmender Textlänge steigt die Robustheit und Genauigkeit von SynthID. Das Verfahren funktioniert sprachübergreifend gut, hat aber Schwächen bei bearbeitetem Text.

Die Methode soll besser funktionieren als existierende Textwasserzeichen-Systeme. Eine detaillierte Beschreibung hat Google Deepmind in der Wissenschaftszeitschrift Nature veröffentlicht.

Empfehlung

KI und Gesellschaft

OpenAIs EU-Blueprint: Wirtschaftsplan oder Wunschzettel?

Integration in Gemini und Open-Source-Veröffentlichung

Google DeepMind hat SynthID in die Gemini-App und -Website integriert, um generierte Texte mit Wasserzeichen zu versehen und zu identifizieren. Darüber hinaus steht die Technologie als Open-Source-Projekt bei Github, im Google Responsible Generative AI Toolkit und bei Hugging Face zur Verfügung, mit dem Ziel, dass mehr Menschen die Textausgaben ihrer eigenen LLMs mit Wasserzeichen versehen.

Google Deepmind hatte SynthID zuvor schon für Bilder und für Stimmen sowie für Musik vorgestellt.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Google DeepMind veröffentlicht KI-Texterkennung für Gemini als Open Source

Subtile Anpassung der Wahrscheinlichkeitsscores

OpenAIs EU-Blueprint: Wirtschaftsplan oder Wunschzettel?

Integration in Gemini und Open-Source-Veröffentlichung

Google Deepmind rüstet sich mit neuen Sicherheitsregeln gegen listige AGIs

OpenAI startet GPT-5 – mit besserem Verständnis, Personalisierung und Entwickler-Tools

Google Deepmind zeigt mit Genie 3 ein KI-Modell für interaktive Welten in Echtzeit

Google schaltet Gemini 2.5 Deep Think frei – und zieht erste Sicherheitsgrenzen

Google DeepMind veröffentlicht KI-Texterkennung für Gemini als Open Source

Subtile Anpassung der Wahrscheinlichkeitsscores

OpenAIs EU-Blueprint: Wirtschaftsplan oder Wunschzettel?

Integration in Gemini und Open-Source-Veröffentlichung

Google Deepmind rüstet sich mit neuen Sicherheitsregeln gegen listige AGIs