Camb AI, ein in Dubai ansässiges Start-up-Unternehmen, das KI-gestützte Technologien für die Lokalisierung von Inhalten erforscht, hat sein Sprachklonmodell Mars5 vorgestellt. Laut Camb bietet Mars5 einen höheren Realismus als das Konkurrenzprodukt von ElevenLabs und unterstützt 140 Sprachen, darunter auch ressourcenarme Sprachen wie Isländisch und Swahili. Mars5 unterstützt Sprachcloning und Text-to-Speech. Der Benutzer lädt eine Audiodatei hoch und gibt den Textinhalt an. Das Modell erfasst dann Stimme, Sprechstil, Emotion und Bedeutung und synthetisiert den Text mit der Stimme des Sprechers. Camb hat auch eine quelloffene Version von Mars5 auf GitHub veröffentlicht, die allerdings nur Englisch unterstützt.

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!