Inhalt
newsletter Newsletter
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
Bewusstsein, Kognition und Künstliche Intelligenz | DEEP MINDS #10

Die Stimme ist ein wichtiger Bestandteil der eigenen Identität. Eine Klinik bietet deshalb KI-Stimmenspeicherung für Menschen, denen krankheitsbedingt der permanente Stimmverlust droht.

Die sogenannte Voice Preservation Clinic (Deutsch: Klinik für Stimmerhaltung) ist eine Kooperation zwischen der Bostoner Northeastern University und des auf KI-Stimmenspeicherung spezialisierten Startups VocaliD.

Das Unternehmen nimmt Patienten mit professioneller Ausrüstung auf. Dabei müssen sie zwei bis drei Stunden Gedichte, Kurzgeschichten oder Reden ins Mikrofon sprechen. Mit dem Stimmmaterial wird ein künstliches neuronales Netz trainiert, das anschließend die Stimme des Patienten imitieren und Worte sowie ganze Sätze sagen kann, die nicht aufgenommen wurden.

Die digitale Stimme wird auf einer App installiert. Tippen die Patienten einen beliebigen Satz, sagt die Künstliche Intelligenz den Satz mit deren Stimme.

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung

Stimmen klonen: Ein Kinderspiel dank KI

Das Startup arbeitet an Filtern, mit denen sich die künstliche Stimme und deren Ausdruck weiter individualisieren lässt. Ebenfalls möglich ist eine künstliche Alterung der Stimme: Werden die Nutzer älter, so sollen die Stimmen entsprechend klingen. Das funktioniert jedoch nur bis zu einem bestimmten Grad: Die Stimme eines Kindes in die eines Teenagers verwandeln, ist derzeit nicht möglich.

Der Preis für eine KI-Stimmenspeicherung beträgt umgerechnet circa 1.600 Euro. Die Kosten werden nach einem Jahr in Rechnung gestellt.

KI-Stimmenimitierung machte in den letzten Jahren rasante Fortschritte. Zwei Beispiele: Googles Übersetzungs-KI Translatotron hört Nutzern zu und übersetzt gesprochene Worte in der Stimme des Nutzers in eine andere Sprache, während Baidus Stimmklon-KI ebenfalls auf Basis minimalen Ausgangsmaterials – 3,7 Sekunden sollen reichen – Stimmen imitiert.

Steht mehr Audiomaterial zur Verfügung, kann die KI Stimmen täuschend echt nachmachen. So wurde die Technologie in manchen Fällen für Diebstähle in Millionenhöhe missbraucht.

Quelle: Guardian

Empfehlung

Weiterlesen über Künstliche Intelligenz:

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Tomislav schreibt über Künstliche Intelligenz im Kontext der XR, Kunst und virtueller Wesen: Wie trägt KI zur Entwicklung von VR und AR bei, wie rekonstruiert und erweitert sie das menschliche Kunstschaffen und welche neue Formen des Geschichtenerzählens und der NPC-Interaktion ermöglicht sie?
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!