Realistische KI-Stimmen: Elevenlabs stellt neues Multisprachen-Modell vor
Kurz & Knapp
- Eleven Labs präsentiert das neue Modell "Eleven Multilingual v2", das 28 Sprachen automatisch erkennt und Text in gesprochene Sprache mit verbesserter Stimmauthentizität im Vergleich zum Vorgängermodell umwandelt.
- Die Eigenschaften der Stimme eines Sprechers bleiben in allen Sprachen erhalten, so dass eine Stimme für alle Sprachen verwendet werden kann.
- Mit mehr als einer Million Nutzern weltweit plant Eleven Labs für die Zukunft eine Funktion, die es Nutzern ermöglicht, Stimmen auf der Plattform zu teilen. Kunden sind vor allem Medienunternehmen, Spieleentwickler, Verlage und unabhängige Autoren.
Elevenlabs hat sich auf die Produktion hochwertiger synthetischer Stimmen spezialisiert. Jetzt stellt das Start-up sein neues Modell vor.
Das neue Modell "Eleven Multilingual v2" unterstützt 28 Sprachen, die es automatisch erkennt und von Text in gesprochene Sprache umsetzt. Dabei erreicht es laut Eleven Labs eine nochmals verbesserte Stimmauthentizität im Vergleich zum Vorgängermodell.
Die Eigenschaften der Stimme eines Sprechers, ob synthetisch erzeugt oder als Stimmklon, bleiben in allen Sprachen erhalten, so dass eine Stimme für alle Sprachen verwendet werden kann.
Bereits die erste Version von Elevenlabs zählte zu den qualitativ hochwertigsten Sprachausgaben auf dem Markt. Eine Demo der neuen Version ist im folgenden Video zu hören.
Eleven Labs unterstützt neu Chinesisch, Koreanisch, Niederländisch, Türkisch, Schwedisch, Indonesisch, Philippinisch, Japanisch, Ukrainisch, Griechisch, Tschechisch, Finnisch, Rumänisch, Dänisch, Bulgarisch, Malaiisch, Slowakisch, Kroatisch, Hocharabisch und Tamil. Englisch, Polnisch, Deutsch, Spanisch, Französisch, Italienisch, Hindi und Portugiesisch werden bereits unterstützt.
Elevenlabs will AI-Voice-Sharing-Plattform starten
Mit der Veröffentlichung von v2 beendet Eleven Labs auch die Beta-Phase. Nach eigenen Angaben hat die eigene Technologie inzwischen mehr als eine Million Nutzerinnen und Nutzer weltweit. Die große Vision sei es, allen Content in jeder Sprache und mit jeder Stimme verfügbar zu machen. In Zukunft soll eine neue Funktion angeboten werden, die es den Nutzenden ermöglicht, Stimmen auf der Plattform zu teilen.
Zielgruppe sind insbesondere Medienunternehmen, Spieleentwickler, Verlage und unabhängige Autoren. Zu den Kunden gehören Unternehmen wie D-ID, Storytel, ScienceCast, TheSoul Publishing, Embark Studios, Paradox Interactive und MNTN. Die eigene Audio-Technologie wurde laut Eleven Labs vollständig im eigenen Haus entwickelt.
KI-News ohne Hype
Von Menschen kuratiert.
- Mehr als 20 Prozent Launch-Rabatt.
- Lesen ohne Ablenkung – keine Google-Werbebanner.
- Zugang zum Kommentarsystem und Austausch mit der Community.
- Wöchentlicher KI-Newsletter.
- 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
- Bis zu 25 % Rabatt auf KI Pro Online-Events.
- Zugang zum kompletten Archiv der letzten zehn Jahre.
- Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.