Die eigene Stimme vermieten ohne zusätzlichen Arbeitsaufwand - das klingt nach einer Geschäftsidee. Umsetzen will sie das Werbe- und Lizenzierungsunternehmen Veritone.
Bekannt geworden sind Deepfakes für einen realistischen Austausch von Gesichtern mit vergleichsweise wenig Aufwand. Dafür wird ein neuronales Netz mit Daten des zu tauschenden Gesichts trainiert (Anleitung).
Dieses KI-Trainingsprinzip funktioniert auch für Audio: Liegen viele Stimmdaten vor, kann mit ihnen ein neuronales Netz so trainiert werden, dass es anschließend, in Verbindung mit einer Stimmsynthese, die Ursprungsstimme mehr oder weniger glaubhaft klonen kann.
Ähnlich wie bei visuellen Deepfakes hat sich diese Technik in den letzten Jahren schnell entwickelt. Schon vor rund zwei Jahren konnte die Stimme des US-Podcasters Joe Rogan so glaubhaft geklont werden, dass sie vom Original kaum mehr zu unterscheiden ist. Von Rogan liegen wegen seiner Podcasts besonders viele, qualitativ hochwertige Stimmdaten vor - das dürfte auch bei vielen anderen bekannten Personen der Fall sein.
Automatisierter Stimmverkauf
Das Werbe- und Lizenzierungsunternehmen Vertione will sich den KI-Fortschritt für eine neue Geschäftsidee zunutze machen: Auf der Plattform Marvel.AI können vornehmlich prominente Personen ihre Stimme KI-klonen und anschließend lizenzieren. Die geklonte Stimme kann dann, sofern der rechtmäßige Lizenzinhaber einverstanden ist, weiterarbeiten, während sich die Originalstimme anderen beruflichen Aufgaben widmet - oder auf der Couch liegt und Netflix glotzt.
"Die Leute wollen diese Deals machen, aber sie haben nicht genug Zeit, um in ein Studio zu gehen und die Inhalte zu produzieren", sagt Veritone-Präsident Ryan Steelberg gegenüber The Verge. "Digitale Influencer, Sportler, Prominente und Schauspieler: Das ist ein riesiges Asset, das Teil ihrer Marke ist."
https://www.youtube.com/watch?v=4WFfm5_nVSQ
Vertione teilt die Stimmklon-Plattform in zwei Bereiche auf: In einer Art Stimm-Shop haben Käufer Zugriff auf bereits trainierte KI-Stimmen und können die gewünschten Aussagen unmittelbar generieren lassen.
Der Fokus soll jedoch auf dem Promi-Service liegen: Inhaber bekannter Stimmen können ihre Stimmdaten an Veritone übergeben, das dann einen Stimmklon erstellt und abstimmt. Die Klonstimme kann dann über Veritones Netzwerk abgerufen und ausgespielt werden, wenn sie benötigt wird. Interessierte Käufer sollen über Marvel.AI Anfragen für ausgewählte Stimmen stellen können.
KI-Stimme oder Original: Veritone will Deepfakes kennzeichnen
Veritone will transparent machen, ob beispielsweise ein Werbespot von der Originalstimme oder der KI-Klonstimme eingesprochen wurde. Steelberg stellt sich zum Beispiel einen bestimmten Klang vor, der standardmäßig industrieweit eingespielt wird, bevor eine KI-Klonstimme spricht.
"Sprachklon-Technologie ist zwar leistungsfähig, sollte aber in einer Weise eingesetzt werden, die klar, konform und einvernehmlich ist", heißt es auf der Webseite des Unternehmens.
Gegenüber reinen Technologie-Unternehmen wähnt sich Veritone im Vorteil, da das eigentliche Geschäft des Unternehmens bereits im Werbe- und Lizenzierungsmarkt liegt. Es hat daher entsprechendes Know-how in der Vermarktung und ein existierendes Netzwerk an Kontakten und Kunden.
Titelbild: Veritone (Screenshot aus Video)