Deepfake-Durchbruch: Gesichtertausch in Echtzeit ohne Training

Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Inhalt
newsletter Newsletter

Israelische Forscher stellen in einem Video eine neue Deepfake-KI vor. Die tauscht Gesichter in Live-Videos glaubhaft in Echtzeit aus - und das ohne langwieriges Training.

Anzeige

Mit dem KI-Gesichtertausch Deepfakes können Prominente ungewollt in Pornos landen, Politikern können Worte in den Mund gelegt werden oder Sylvester Stallone darf endlich den Terminator spielen. Allerdings: Bisherige Deepfake-KIs müssen für jedes Gesicht neu trainiert werden. Wer gute Ergebnisse will, muss den Algorithmus dutzende Stunden oder sogar mehrere Tage trainieren und benötigt tausende hochwertige Gesichtsfotos. Bislang.

Im Mai stellte Samsung dann eine KI vor, die aus wenigen Fotos einer Person realistisch animierte sprechende Köpfe generieren kann. Glaubwürdige Deepfakes ohne langwieriges Training nur mit einer Handvoll Fotos schienen schon damals in Reichweite - und sind jetzt offenbar erreicht.

Neuer Deepfake funktioniert mit jedem Gesicht - ohne spezfisches Training

Das nun vorgestellte Face Swapping GAN (FSGAN) verbessert diesen Ansatz weiter: Universale Deepfakes funktionieren ohne spezifisches Gesichter-Training für jede beliebige Person - und das auch noch in Echtzeit. Im Demovideo überträgt die KI problemlos Gesichter von einem Live-Video ins andere.

Anzeige
Anzeige
Vier Netzwerke arbeiten in drei Schritten am Deepfake. Bild: Nirkin et al.
Vier Netzwerke arbeiten in drei Schritten am Deepfake. Bild: Nirkin et al.

Möglich wird dieser Durchbruch durch KI-Arbeitsteilung. Die Echtzeit-Deepfake-KI besteht aus vier spezialisierten neuronalen Netzen:

Das erste Netz kopiert das Gesicht, das zweite erkennt Haare und Gesicht im Zielvideo, ein drittes passt das kopierte Gesicht anschließend an das Ziel-Gesicht an, etwa wenn Haare im Weg sind. Das letzte Netzwerk ist für den Feinschliff zuständig und modifiziert Hautfarbe und Beleuchtung.

Die einzelnen Netzwerke wurden zwei Tage mit Millionen von Gesichtern trainiert. Günstig war das Training nicht: Die Forscher verwendeten acht Nvidia Tesla v100 Grafikkarten. Kosten pro Karte: 9.000 Euro.

Auf dem Bild zu sehen: Es braucht alle Netzwerke, um das Gesicht zu kopieren, die Haare zu richten und Hautfarbe und Beleuchtung anzupassen. Bild: Nirkin et al.
Auf dem Bild zu sehen: Es braucht alle vier vortrainierten neuronalen Netzwerke, um das Gesicht zu kopieren, die Haare zu richten und Hautfarbe und Beleuchtung anzupassen. Bild: Nirkin et al.

Auch diese Deepfake-KI wird Open Source

Auf ihrer Projektseite kündigen die Forscher eine Veröffentlichung des Open-Source-Codes bei GitHub an. Sollten die Forscher ihrer Deepfake-KI fertig trainiert veröffentlichen, stünde einer explosionsartigen Verbreitung von Deepfake-Videos wohl nichts mehr im Wege - sofern sich die im Video demonstrierte Qualität als authentisch erweist.

Die Forscher halten es jedoch für ihre Pflicht, die Technologie zu veröffentlichen. Nur so könnten Gegenmaßnahmen entwickelt und Gesetzgeber zum Handeln gezwungen werden, heißt es in der Veröffentlichung.

Empfehlung

Quellen: Arxiv.org, Project Page

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Weiterlesen über Deepfakes:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!