Das offene Stimmmodell "Chatterbox Turbo" will Elevenlabs Konkurrenz machen. Laut Resemble AI übertrifft Chatterbox Turbo die Modelle von Elevenlabs und Cartesia in der Sprachqualität. Das Modell liefert erste Töne in unter 150 Millisekunden und kann Stimmen aus nur fünf Sekunden Audiomaterial klonen. Das Modell soll sich an Entwickler von Echtzeit-Agenten, Kundensupport-Systemen, Spielen, Avataren und sozialen Plattformen sowie an Unternehmen in regulierten Branchen richten. Es unterstützt zudem das sogenannte "PerTh"-Wasserzeichen zur Verifizierung der erzeugten Sprache.
Das KI-Start-up Resemble AI hat das Sprachmodell unter MIT-Lizenz veröffentlicht. Es darf kostenlos genutzt, verändert und weiterverbreitet werden – auch kommerziell. Das Modell kann auf Hugging Face, RunPod, Modal, Replicate und Fal getestet werden. Der Code ist auf GitHub verfügbar. Ein gehosteter Dienst ist bei Resemble AI verfügbar, einer mit niedriger Latenz soll bald folgen.

