OpenAI hat ein ziemlich gutes Stimmenklon-Modell

OpenAI hat ein ziemlich gutes Stimmenklon-Modell - und warnt vor den Risiken

Ideogram prompted by THE DECODER

OpenAI gibt einen Einblick in die Voice Engine, ein Modell zur Erzeugung von Stimmklonen aus 15 Sekunden langen Stimmproben. Die Ergebnisse sind sehr überzeugend - und das ist ein Risiko.

OpenAI hat erste Erkenntnisse und Ergebnisse seines KI-Modells Voice Engine vorgestellt, das aus einer kurzen Texteingabe und einer 15-sekündigen Sprachprobe einen natürlich klingenden Sprachklon erzeugen kann, der dem Original sehr nahekommt.

Englisches Referenzaudio (15 Sekunden)

Generierte Stimme basierend auf Referenzaudio

Voice Engine wurde Ende 2022 entwickelt und wird bereits für vordefinierte Stimmen in der Text-to-Speech-API sowie für ChatGPT Voice und Read Aloud verwendet. Gleichzeitig geht OpenAI aufgrund des Missbrauchspotenzials vorsichtig mit einer breiteren Veröffentlichung um.

Seit Ende letzten Jahres wird die OpenAI Voice Engine privat mit einer kleinen Gruppe von Partnern getestet. Einige erste Anwendungsbeispiele sind

Bessere Unterstützung für Leseunkundige und Kinder durch natürliche und emotionale Stimmen.
Übersetzung von Videos und Podcasts, damit die Autoren ein größeres Publikum in ihrer Muttersprache erreichen können (HeyGen).
Verbesserung der Grundversorgung in abgelegenen Gebieten.
Unterstützung für Menschen, die nicht sprechen können, z. B. für therapeutische Anwendungen bei Sprachstörungen.
Wiederherstellung der Stimme von Patienten mit plötzlichem oder fortschreitendem Stimmverlust.

OpenAI ist sich der erheblichen Risiken von Voice Engine bewusst, insbesondere der Gefahr von Wahlbetrug in einem Wahljahr. Die derzeitigen Testpartner müssen sich an Nutzungsrichtlinien halten, die Nachahmungen ohne Zustimmung verbieten. Sie müssen die ausdrückliche Zustimmung des Originalsprechers einholen und dürfen den Nutzern nicht erlauben, eigene Stimmen zu erstellen. KI-generierte Stimmen müssen deutlich gekennzeichnet werden.

Englisches Referenzaudio

Stimmklon in deutscher Sprache (HeyGen)

Empfehlung

KI in der Praxis

Führungskrise oder Ende des KI-Hypes? OpenAI verliert viele Schlüsselfiguren

OpenAI fordert Einschränkungen bei der Stimmauthentifizierung

Voice Engine soll zeigen, was mit KI-Stimmklonen möglich ist. Es sei wichtig, dass die Welt verstehe, wohin sich diese Technologie entwickle - unabhängig davon, ob OpenAI sie letztlich selbst in großem Umfang einsetzen werde oder nicht.

OpenAI fordert den Verzicht auf Stimmauthentifizierung bei sensiblen Daten, den Schutz der Verwendung von Stimmen, Aufklärung über die Möglichkeiten und Grenzen von KI sowie bessere Techniken zur Rückverfolgung von Inhalten.

Darüber hinaus setzt das Unternehmen auf Sicherheitsmaßnahmen wie die Verwendung von Wasserzeichen zur Rückverfolgbarkeit und die proaktive Überwachung der Nutzung. Authentifizierungsprozesse und Sperrlisten für prominente Stimmen seien wichtig.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

OpenAI hat ein ziemlich gutes Stimmenklon-Modell - und warnt vor den Risiken

Führungskrise oder Ende des KI-Hypes? OpenAI verliert viele Schlüsselfiguren

OpenAI fordert Einschränkungen bei der Stimmauthentifizierung

Sutskever wird CEO von Safe Superintelligence Inc. - und will eigenständig bleiben

OpenAI und Oracle bauen Stargate-Projekt in den USA massiv aus

Google macht seine Video-KI Veo 3 Fast weltweit über Gemini Pro verfügbar

Cloudflare-Boss Matthew Prince hat schlechte Nachrichten für das WWW

Othello-Experiment stützt erneut Weltmodell-Hypothese für große Sprachmodelle

MIT-Studie zeigt "kognitive Schulden" durch ChatGPT - was das für die Praxis bedeutet

OpenAI hat ein ziemlich gutes Stimmenklon-Modell - und warnt vor den Risiken

OpenAI fordert Einschränkungen bei der Stimmauthentifizierung

Artikel teilen

Bankverbindung