Inhalt
summary Zusammenfassung

Das auf synthetische Stimmen spezialisierte Start-up Elevenlabs präsentiert sechs klassische Geschichten, die von einer glaubwürdigen KI-Stimme mehrsprachig vertont wurden.

Darunter sind Klassiker wie "Winnie Puuh" und "Das Bildnis des Dorian Gray". Der "große Traum" des Unternehmens sei es, jedes öffentliche Buch in jeder Sprache und mit jeder Stimme in hoher Qualität verfügbar zu machen.

Der gesamte Prozess dauerte laut Elevenlabs nur einen Tag. Das folgende Video spielt die Vertonung von "The Picture of Dorian Gray" ab.

Die Qualität der Vertonung ist so hoch, dass sie die Debatte über den Ersatz von Synchronsprechern durch KI, die im Zuge der Proteste in Hollywood aufkam und auch in der Spieleindustrie geführt wird, neu entfachen dürfte. So musste sich etwa das Spielestudio Ninja Theory nach Kritik rechtfertigen, dass es menschliche Stimmen nicht durch KI ersetze. Diese würden lediglich als Platzhalter in der Spieleentwicklung dienen.

Anzeige
Anzeige

Microsoft und Project Gutenberg stellten kürzlich ein Projekt vor, bei dem mehr als 5.000 Hörbücher mit KI-Stimmen automatisch produziert wurden. Die Forscher entwickelten Algorithmen, die in der Lage sind, den Haupttext eines E-Books von unwichtigen Elementen wie Fußnoten und Seitenzahlen und zwischen Sprechern, Dialogen und Charakteren zu unterscheiden, um mit unterschiedlichen Rollen und Emotionen zu erzählen.

Elevenlabs stellt neues Multisprachenmodell vor

Elevenlabs hat kürzlich sein neues Modell "Eleven Multilingual v2" vorgestellt, das 28 Sprachen unterstützt und diese automatisch von Text in gesprochene Sprache umwandeln kann. Dabei bleibt die Authentizität der Stimme in allen Sprachen erhalten.

Mit der Veröffentlichung von "Eleven Multilingual v2" beendet Elevenlabs auch seine Betaphase. Das Start-up plant nun die Integration einer Funktion, die es den Nutzern ermöglicht, ihre Stimmen auf der Plattform zu teilen, um so eine globale Sprachgemeinschaft aufzubauen.

Elevenlabs hat laut eigenen Angaben mehr als eine Million Nutzer weltweit und zählt mehrere Medienunternehmen, Spieleentwickler, Verlage und unabhängige Autoren zu seinen Kunden.

Weitere KI-Hörbücher von ElevenLabs gibt es auf Twitter.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Elevenlabs, ein auf Sprachsynthese spezialisiertes Start-up, präsentiert sechs klassische Geschichten, die von überzeugenden KI-Stimmen in mehreren Sprachen erzählt werden, darunter "Winnie Puuh" und "Das Bildnis des Dorian Gray"
  • Ziel des Unternehmens ist es, jedes öffentliche Buch in allen Sprachen und Stimmen in hoher Qualität verfügbar zu machen. Der gesamte Aufnahmeprozess in hoher Qualität dauerte nur einen Tag.
  • Elevenlabs hat kürzlich sein Modell "Eleven Multilingual v2" vorgestellt, das 28 Sprachen unterstützt und Text automatisch in gesprochene Sprache umwandelt, wobei die Authentizität der Stimme erhalten bleibt.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!