KI-Forschung

Facebook zeigt Deepfake-Text-KI - und warnt davor

Matthias Bastian
Die Beschriftung eines Parkverbotsschilds wurde digital ausgetauscht, sodass es so aussieht, als dürfe man parken - dabei ist es eigentlich verboten.

In einer neuen Forschungsarbeit zeigt Facebook erneut, dass Künstliche Intelligenz ein grundlegender Baustein für fortschrittliche Augmented Reality ist - und macht auf neue Deepfake-Risiken im Alltag aufmerksam.

Mit dem KI-Modell "TextStyleBrush" kann Facebook realen, durch eine Kameralinse betrachteten Text - beispielsweise auf einem Preisschild - in Echtzeit durch digitalen Text ersetzen.

Die digitale Textersetzung erscheint dabei visuell beinahe identisch zum Originaltext: Aus einem eigentlich englisch beschriebenem Kreide-Preisschild wird dann ein französisches im gleichen Aussehen.

Die Besonderheit an Facebooks KI-Modell ist die hochwertige visuelle Übersetzung und Ersetzung von handschriftlichem Text - dafür genügt dem Modell ein einzelnes Textbeispiel. | Bild: Facebook

Mit einer fortschrittlichen Augmented-Reality-Brille, an der Facebook bekanntlich arbeitet, könnte man so beispielsweise eine fremdsprachige Stadt in der eigenen Sprache wahrnehmen. Die visuelle Authentizität - abseits der Schriftzeichen - bliebe erhalten. Als weitere Anwendungsszenarien nennt Facebook personalisierte Nachrichten und Bildunterschriften.

Wie ein Babelfisch fürs Auge

Neu ist diese digitale Textaustauschtechnik nicht. Google integrierte im eigenen Übersetzungsservice Translate bereits im Sommer 2019 eine vergleichbare Funktion. Das folgende Video zeigt sie im Einsatz.

Allerdings soll Facebooks selbstüberwacht trainiertes KI-Modell (Erklärung) flexibler und akkurater bei verschiedenen Textstilen sein und handschriftlichen Text auf hohem Niveau erkennen und ersetzen können. Für den digitalen Textersatz genügt dem Modell ein einzelnes Wort-Beispiel des zu ersetzenden Textes.

Das KI-Modell extrahiert den zu übersetzenden Text möglichst genau aus einer realen Szene, bevor es die Übersetzung und den Stil-Transfer in zwei parallel laufenden Prozessen steuert ...  | Bild: Facebook
... und dann ein neues Bild mit geändertem Text generiert. In diesem Fall entsteht eine Kanne, die für Tee-Genießer eine gesalzene Überraschung bereithält. | Bild: Facebook

Laut Facebook übertrifft TextStyleBrush vergleichbare KI-Modelle in automatisierten Tests und Nutzerstudien für jede Art von Text. Als Grundlage nutzt Facebook eine für Textgenerierung modifizierte Version von Nvidias Open Source KI-Generator StyleGAN2.

Facebooks KI-Modell kann viele unterschiedliche Textstile analysieren und visuell imitieren. Das ist die Grundlage des digitalen Textaustauschs. | Bild: Facebook

Facebook warnt vor Deepfake-Text-Attacken

Übersetzungen sind ein positives Anwendungsszenario für Facebooks neue KI Technologie, die allerdings viele Risiken birgt. Facebook weiß das und warnt daher vorausschauend vor "Deepfake-Text-Attacken", bei denen textuelle Anweisungen im öffentlichen Raum - beispielsweise auf Straßenschildern - gezielt ausgetauscht werden, um Schaden zu verursachen oder zu betrügen. Der Konzern veranschaulicht das anhand einiger Beispiele.

Facebook veröffentlicht den Code von TextStyleBrush wegen dieses Risikos nicht als Open Source, wohl aber das Forschungspapier sowie den Datensatz für das KI-Training.

"Wie bei unserem Ansatz zu Deepfakes glauben wir, dass der Austausch von Forschungsergebnissen und Datensätzen dabei helfen wird, Erkennungssysteme zu entwickeln und Angriffen vorzubeugen", sagt Facebooks Technikchef Mike Schroepfer.

Ziel müssten robuste Erkennungssysteme sein, die diese "neue Art von Deepfakes" bekämpfen können und den Gegnern einen Schritt voraus sind, so Facebooks KI-Forscher.

Zwar stecke die Technologie noch in der Forschungsphase, könne aber in der Zukunft eine "Vielzahl nützlicher Anwendungsszenarien" ermöglichen "und vielleicht eines Tages die Übersetzung von Straßenschildern in der realen Welt mithilfe von AR."

Quelle: Facebook

Weiterlesen über Deepfakes: