In einer neuen Forschungsarbeit zeigt Facebook erneut, dass Künstliche Intelligenz ein grundlegender Baustein für fortschrittliche Augmented Reality ist - und macht auf neue Deepfake-Risiken im Alltag aufmerksam.
Mit dem KI-Modell "TextStyleBrush" kann Facebook realen, durch eine Kameralinse betrachteten Text - beispielsweise auf einem Preisschild - in Echtzeit durch digitalen Text ersetzen.
Die digitale Textersetzung erscheint dabei visuell beinahe identisch zum Originaltext: Aus einem eigentlich englisch beschriebenem Kreide-Preisschild wird dann ein französisches im gleichen Aussehen.
Mit einer fortschrittlichen Augmented-Reality-Brille, an der Facebook bekanntlich arbeitet, könnte man so beispielsweise eine fremdsprachige Stadt in der eigenen Sprache wahrnehmen. Die visuelle Authentizität - abseits der Schriftzeichen - bliebe erhalten. Als weitere Anwendungsszenarien nennt Facebook personalisierte Nachrichten und Bildunterschriften.
Wie ein Babelfisch fürs Auge
Neu ist diese digitale Textaustauschtechnik nicht. Google integrierte im eigenen Übersetzungsservice Translate bereits im Sommer 2019 eine vergleichbare Funktion. Das folgende Video zeigt sie im Einsatz.
Allerdings soll Facebooks selbstüberwacht trainiertes KI-Modell (Erklärung) flexibler und akkurater bei verschiedenen Textstilen sein und handschriftlichen Text auf hohem Niveau erkennen und ersetzen können. Für den digitalen Textersatz genügt dem Modell ein einzelnes Wort-Beispiel des zu ersetzenden Textes.
Laut Facebook übertrifft TextStyleBrush vergleichbare KI-Modelle in automatisierten Tests und Nutzerstudien für jede Art von Text. Als Grundlage nutzt Facebook eine für Textgenerierung modifizierte Version von Nvidias Open Source KI-Generator StyleGAN2.
Facebook warnt vor Deepfake-Text-Attacken
Übersetzungen sind ein positives Anwendungsszenario für Facebooks neue KI Technologie, die allerdings viele Risiken birgt. Facebook weiß das und warnt daher vorausschauend vor "Deepfake-Text-Attacken", bei denen textuelle Anweisungen im öffentlichen Raum - beispielsweise auf Straßenschildern - gezielt ausgetauscht werden, um Schaden zu verursachen oder zu betrügen. Der Konzern veranschaulicht das anhand einiger Beispiele.
Facebook veröffentlicht den Code von TextStyleBrush wegen dieses Risikos nicht als Open Source, wohl aber das Forschungspapier sowie den Datensatz für das KI-Training.
"Wie bei unserem Ansatz zu Deepfakes glauben wir, dass der Austausch von Forschungsergebnissen und Datensätzen dabei helfen wird, Erkennungssysteme zu entwickeln und Angriffen vorzubeugen", sagt Facebooks Technikchef Mike Schroepfer.
Ziel müssten robuste Erkennungssysteme sein, die diese "neue Art von Deepfakes" bekämpfen können und den Gegnern einen Schritt voraus sind, so Facebooks KI-Forscher.
Zwar stecke die Technologie noch in der Forschungsphase, könne aber in der Zukunft eine "Vielzahl nützlicher Anwendungsszenarien" ermöglichen "und vielleicht eines Tages die Übersetzung von Straßenschildern in der realen Welt mithilfe von AR."
Quelle: Facebook