Camb AI, ein in Dubai ansässiges Start-up-Unternehmen, das KI-gestützte Technologien für die Lokalisierung von Inhalten erforscht, hat sein Sprachklonmodell Mars5 vorgestellt. Laut Camb bietet Mars5 einen höheren Realismus als das Konkurrenzprodukt von ElevenLabs und unterstützt 140 Sprachen, darunter auch ressourcenarme Sprachen wie Isländisch und Swahili. Mars5 unterstützt Sprachcloning und Text-to-Speech. Der Benutzer lädt eine Audiodatei hoch und gibt den Textinhalt an. Das Modell erfasst dann Stimme, Sprechstil, Emotion und Bedeutung und synthetisiert den Text mit der Stimme des Sprechers. Camb hat auch eine quelloffene Version von Mars5 auf GitHub veröffentlicht, die allerdings nur Englisch unterstützt.
Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
News, Tests und Berichte über VR, AR und MIXED Reality.
XR-Wochenrückblick: Meta präsentiert die VR-Brille für den Mainstream, VR-Blockbuster wird verschoben & AR ist die Zukunft
Exklusiv für Meta Quest 3: Top-VR-Studio bringt fünf Sportarten in die Mixed Reality
Meta Quest: Square Enix portiert beliebtes Taktik-RPG in VR samt Mixed Reality-Modus
MIXED.de
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!