Anzeige
Short

Metas Voicebox ist wie Stable Diffusion für Stimmen: Das generative KI-Modell synthetisiert Stimmen aus Text und kann für verschiedene Sprachaufgaben eingesetzt werden. Voicebox erzeugt realistische und ausdrucksstarke Stimmen und erlaubt die Übernahme von Attributen wie Tonfall, Stil oder Akzent aus Audiodateien.

Laut Meta übertrifft Voicebox bestehende Sprachsynthesemodelle wie VALL-E von Microsoft in puncto Sprachqualität und Natürlichkeit. "Als erstes vielseitiges und effizientes Modell, das sich erfolgreich auf verschiedene Aufgaben verallgemeinern lässt, könnte Voicebox unserer Meinung nach eine neue Ära der generativen KI für gesprochene Sprache einläuten", so Meta. Aufgrund des Missbrauchsrisikos hat das Team auch ein System zur Erkennung synthetisierter Sprache entwickelt und die Veröffentlichung von Voicebox vorerst zurückgestellt.

Video: Meta

Anzeige
Anzeige
Anzeige
Anzeige
Short

Google DeepMind, OpenAI und Anthropic gewähren der britischen Regierung Zugang zu ihren KI-Modellen für Forschungs- und Sicherheitszwecke, kündigte Premierminister Rishi Sunak am Montag auf der London Tech Week an. Das Vereinigte Königreich will ein globaler Knotenpunkt für die Regulierung der KI-Sicherheit werden.

Geplant sind ein globaler KI-Sicherheitsgipfel und eine mit 100 Millionen Pfund ausgestattete Foundation Model Taskforce. OpenAI und Anthropic haben kürzlich ihren europäischen Hauptsitz in Großbritannien eingerichtet.

"KI ist sicherlich eine der größten Chancen, die wir haben", sagte Sunak. Aber die Technologie müsse sicher entwickelt und eingesetzt werden, "ich weiß, dass die Menschen besorgt sind."

Anzeige
Anzeige
Short

Synthesia, eine KI-Plattform für synthetische Medien, hat 90 Millionen US-Dollar erhalten und damit eine Bewertung von 1 Milliarde US-Dollar erreicht. Die Runde wurde von Accel angeführt, zu den Investoren gehören Nvidia und andere wie Kleiner Perkins, GV, FirstMark Capital und MMC.

Synthesia ist ein in London ansässiges Unternehmen, das künstliche Intelligenz in der Videoproduktion einsetzt. Die Technologie ermöglicht es Nutzer:innen, digitale Avatare zu erstellen, die Präsentationen oder Schulungsvideos in mehreren Sprachen vorführen können.

Google News