KI-Forschung

18. Juni 202318. Juni 2023

Maximilian Schreiner

Metas Voicebox ist Stable Diffusion für Stimmen

Maximilian Schreiner

Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.

Profil

E-Mail

Metas Voicebox ist wie Stable Diffusion für Stimmen: Das generative KI-Modell synthetisiert Stimmen aus Text und kann für verschiedene Sprachaufgaben eingesetzt werden. Voicebox erzeugt realistische und ausdrucksstarke Stimmen und erlaubt die Übernahme von Attributen wie Tonfall, Stil oder Akzent aus Audiodateien.

Anzeige

Laut Meta übertrifft Voicebox bestehende Sprachsynthesemodelle wie VALL-E von Microsoft in puncto Sprachqualität und Natürlichkeit. "Als erstes vielseitiges und effizientes Modell, das sich erfolgreich auf verschiedene Aufgaben verallgemeinern lässt, könnte Voicebox unserer Meinung nach eine neue Ära der generativen KI für gesprochene Sprache einläuten", so Meta. Aufgrund des Missbrauchsrisikos hat das Team auch ein System zur Erkennung synthetisierter Sprache entwickelt und die Veröffentlichung von Voicebox vorerst zurückgestellt.

Video: Meta

Anzeige

Anzeige

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:

Banküberweisung

Quellen

Meta

Maximilian Schreiner

Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.

Profil

E-Mail

KI und Gesellschaft

3. Juli 2025

Meta plant proaktive KI-Bots für mehr Nutzerbindung

News, Tests und Berichte über VR, AR und MIXED Reality.

Wie es mit MIXED weitergeht Mein persönlicher Abschied von MIXED Meta und Anduril entwickeln jetzt gemeinsam VR-Brillen fürs US-Militär MIXED.de

KI-Forschung

27. Juni 2025

Meta erwägte Abkehr von eigenem KI-Modell zugunsten externer Systeme

KI-Forschung

16. Mai 2025

Zuckerbergs KI-Ambitionen stocken: "Behemoth"-Modell kommt frühestens im Herbst

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!