Das KI-Startup Zyphra hat das Open-Source-Modell Zonos-v0.1 auf Hugging Face veröffentlicht. Es ermöglicht die Generierung natürlich klingender Sprache aus Texteingaben und Voice Cloning mit nur 5-30 Sekunden Sprachdaten. Es unterstützt Englisch, Japanisch, Chinesisch, Französisch und Deutsch. Es bietet Kontrolle über Sprechgeschwindigkeit, Tonhöhe, Audioqualität und Emotionen. Laut Zyphria läuft Zonos auf einer RTX 4090 GPU schneller als in Echtzeit. Es verfügt über eine benutzerfreundliche Gradio-Oberfläche und lässt sich mit Docker einfach installieren und einsetzen. Das Modell wurde mit ca. 200.000 Stunden hauptsächlich englischsprachiger Sprachdaten trainiert und ist in zwei Varianten verfügbar: Ein reines Transformer-Modell und ein hybrides Modell, das State-Space-Modelle mit Transformern kombiniert. Zonos kann außerdem im Zyphra-Playground oder via API aufgerufen werden.
Today, we're excited to announce a beta release of Zonos, a highly expressive TTS model with high fidelity voice cloning.
We release both transformer and SSM-hybrid models under an Apache 2.0 license.
Zonos performs well vs leading TTS providers in quality and expressiveness. pic.twitter.com/jaliZNJecm
— Zyphra (@ZyphraAI) February 10, 2025
External media content (Twitter) has been blocked here. When loading or playing, connections are established to the servers of the respective providers. Personal data may be communicated to the providers in the process. You can find more information in our privacy policy.
Wenn ihr nur ein Video über KI diese Woche schaut, sollte es dieses sein. Der KI-Experte Andrej Karpathy, ehemals bei OpenAI und Tesla, erklärt in einem YouTube-Video detailliert die Technologie hinter Large Language Models (LLMs) wie ChatGPT. Er geht auf den gesamten Trainingsprozess ein, liefert mentale Modelle zur "Psychologie" der Systeme und gibt Tipps für den praktischen Einsatz. Karpathy möchte laut eigenen Angaben mit dem Video das Verständnis für den aktuellen Stand der KI-Technik fördern und Menschen befähigen, das Beste daraus für ihre Arbeit zu machen. Der studierte Physiker ist Mitbegründer von Eureka Labs, einem KI-gestützten Bildungsunternehmen.
External media content (www.youtube.com) has been blocked here. When loading or playing, connections are established to the servers of the respective providers. Personal data may be communicated to the providers in the process. You can find more information in our privacy policy.