Chatterbox Turbo: Kostenloses Audio-Modell klont Stimmen in wenigen Sekunden
Das offene Stimmmodell "Chatterbox Turbo" will Elevenlabs Konkurrenz machen. Laut Resemble AI übertrifft Chatterbox Turbo die Modelle von Elevenlabs und Cartesia in der Sprachqualität. Das Modell liefert erste Töne in unter 150 Millisekunden und kann Stimmen aus nur fünf Sekunden Audiomaterial klonen. Das Modell soll sich an Entwickler von Echtzeit-Agenten, Kundensupport-Systemen, Spielen, Avataren und sozialen Plattformen sowie an Unternehmen in regulierten Branchen richten. Es unterstützt zudem das sogenannte "PerTh"-Wasserzeichen zur Verifizierung der erzeugten Sprache.
Das KI-Start-up Resemble AI hat das Sprachmodell unter MIT-Lizenz veröffentlicht. Es darf kostenlos genutzt, verändert und weiterverbreitet werden – auch kommerziell. Das Modell kann auf Hugging Face, RunPod, Modal, Replicate und Fal getestet werden. Der Code ist auf GitHub verfügbar. Ein gehosteter Dienst ist bei Resemble AI verfügbar, einer mit niedriger Latenz soll bald folgen.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnieren