KI in der Praxis

Wombo.ai: Neue Deepfake-App lässt eure Fotos singen

Matthias Bastian
Das App-Interface der Smartphone-App Wombo

Mit der Smartphone-App Wombo AI könnt ihr Fotos von Gesichtern mit einer Deepfake-Gesangsanimation versehen.

Seit ihrer Erfindung erobern Deepfakes (Geschichte) das Netz und breiten sich zunehmend aus. Ihre Identität suchen sie noch: Angriff auf die Meinungsbildung, Kunstform, Hollywood-Gamechanger, Zeitreisen oder Gesichterdiebstahl für Pornos - Deepfakes mischen überall ein bisschen mit.

Dass sie auch Klamauk können, zeigt jetzt die Smartphone-App Wombo.ai. Entwickelt wurde sie von einem kanadischen Team seit August 2020. Die erste Beta erschien im Januar, seitdem wurde die App mehr als zwei Millionen Mal heruntergeladen.

Einfache Deepfake-Memes für jedermann

Die Idee zu Wombo.ai hatte Ben-Zion Benkhin. Er wollte eine einfache App entwickeln, mit der jedermann ein "absurdes, leicht zu teilendes und unterhaltsames Video" erstellen kann. Seine Erfindung bezeichnet er als die "weltbeste KI-gestützte Lippen-Synchronisierungs-App".

Grundlage für den Videotrick sind reale Videoaufnahmen eines Darstellers, in denen er typische Meme-Songs mit passender Mimik einsingt. Mit den Videodaten trainierte das Wombo-Team eine KI, die diese Animationen auf beliebige Fotos übertragen kann, auf denen sie ein Gesicht erkennt.

So kann man beispielsweise Nordkoreas Machthaber Kim Jong-un ein eindrucksvolles "I will survive" schmettern lassen.

Auch US-Präsident Joe Biden taugt nach der Wombo-Behandlung als Song-Meme.

Obwohl Wombo AI für reale Gesichter trainiert wurde, kann die App auch gezeichnete oder computergenerierte Gesichter erkennen und nachträglich animieren, wie das folgende Beispiel zeigt.

Sogar Haustiere animierter Wombo recht souverän.

Die hochgeladenen Gesichtsdaten werden laut der Datenschutzbestimmung nur für die Videoerstellung verarbeitet und anschließend gelöscht. Der Service nutzt Amazon Web Services für die Berechnung der Videos.

Vorsicht vor dem Hals

Derzeit bietet Wombo AI 17 Songs zur Auswahl, zu denen die KI ein Gesicht animieren kann. Die App ist kostenlos für iOS und Android verfügbar. Gegen Bezahlung gibt es sie werbefrei und mit schnellerer Datenverarbeitung.

Laut Benkhin sollen außerdem Künstler angefragt haben, ob sie mit der App ihre Songs einsingen dürfen für einen viralen Marketing-Effekt. Er hat Pläne, die Plattform mit Nutzerprofilen auszubauen, um beispielsweise neue Musik zu entdecken. Eine technische Schwachstelle hat die Wombo-KI noch: Auf den zu animierenden Fotos sollte der Mund leicht geöffnet sein, damit die KI ihn korrekt wiedererkennt. Sonst sucht sie sich womöglich ein falsches Animationsziel im Bild - mit verstörendem Ergebnis.

Eine vergleichbare Smartphone-App ist Doublicat, die euer Gesicht mit einem Klick mit dem bekannter Hollywood-Stars tauscht. Hochwertige Deepfakes hingegen bedeuten mehr Produktionsaufwand, allerdings sinkt auch hier die Hürde kontinuierlich.

Via: Twitter, Insider, The Verge

Weiterlesen über Deepfakes: