Das auf synthetische Stimmen spezialisierte Start-up Elevenlabs präsentiert sechs klassische Geschichten, die von einer glaubwürdigen KI-Stimme mehrsprachig vertont wurden.
Darunter sind Klassiker wie "Winnie Puuh" und "Das Bildnis des Dorian Gray". Der "große Traum" des Unternehmens sei es, jedes öffentliche Buch in jeder Sprache und mit jeder Stimme in hoher Qualität verfügbar zu machen.
Der gesamte Prozess dauerte laut Elevenlabs nur einen Tag. Das folgende Video spielt die Vertonung von "The Picture of Dorian Gray" ab.
Die Qualität der Vertonung ist so hoch, dass sie die Debatte über den Ersatz von Synchronsprechern durch KI, die im Zuge der Proteste in Hollywood aufkam und auch in der Spieleindustrie geführt wird, neu entfachen dürfte. So musste sich etwa das Spielestudio Ninja Theory nach Kritik rechtfertigen, dass es menschliche Stimmen nicht durch KI ersetze. Diese würden lediglich als Platzhalter in der Spieleentwicklung dienen.
Microsoft und Project Gutenberg stellten kürzlich ein Projekt vor, bei dem mehr als 5.000 Hörbücher mit KI-Stimmen automatisch produziert wurden. Die Forscher entwickelten Algorithmen, die in der Lage sind, den Haupttext eines E-Books von unwichtigen Elementen wie Fußnoten und Seitenzahlen und zwischen Sprechern, Dialogen und Charakteren zu unterscheiden, um mit unterschiedlichen Rollen und Emotionen zu erzählen.
Elevenlabs stellt neues Multisprachenmodell vor
Elevenlabs hat kürzlich sein neues Modell "Eleven Multilingual v2" vorgestellt, das 28 Sprachen unterstützt und diese automatisch von Text in gesprochene Sprache umwandeln kann. Dabei bleibt die Authentizität der Stimme in allen Sprachen erhalten.
Mit der Veröffentlichung von "Eleven Multilingual v2" beendet Elevenlabs auch seine Betaphase. Das Start-up plant nun die Integration einer Funktion, die es den Nutzern ermöglicht, ihre Stimmen auf der Plattform zu teilen, um so eine globale Sprachgemeinschaft aufzubauen.
Elevenlabs hat laut eigenen Angaben mehr als eine Million Nutzer weltweit und zählt mehrere Medienunternehmen, Spieleentwickler, Verlage und unabhängige Autoren zu seinen Kunden.
Weitere KI-Hörbücher von ElevenLabs gibt es auf Twitter.