Skip to content

Zonos kann eure Stimme klonen und ist Open Source

Das KI-Startup Zyphra hat das Open-Source-Modell Zonos-v0.1 auf Hugging Face veröffentlicht. Es ermöglicht die Generierung natürlich klingender Sprache aus Texteingaben und Voice Cloning mit nur 5-30 Sekunden Sprachdaten. Es unterstützt Englisch, Japanisch, Chinesisch, Französisch und Deutsch. Es bietet Kontrolle über Sprechgeschwindigkeit, Tonhöhe, Audioqualität und Emotionen. Laut Zyphria läuft Zonos auf einer RTX 4090 GPU schneller als in Echtzeit. Es verfügt über eine benutzerfreundliche Gradio-Oberfläche und lässt sich mit Docker einfach installieren und einsetzen. Das Modell wurde mit ca. 200.000 Stunden hauptsächlich englischsprachiger Sprachdaten trainiert und ist in zwei Varianten verfügbar: Ein reines Transformer-Modell und ein hybrides Modell, das State-Space-Modelle mit Transformern kombiniert. Zonos kann außerdem im Zyphra-Playground oder via API aufgerufen werden.

— Zyphra (@ZyphraAI) February 10, 2025

Quelle: Zonos

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren