Anzeige
Anzeige
Anzeige
Short

Das KI-Startup Zyphra hat das Open-Source-Modell Zonos-v0.1 auf Hugging Face veröffentlicht. Es ermöglicht die Generierung natürlich klingender Sprache aus Texteingaben und Voice Cloning mit nur 5-30 Sekunden Sprachdaten. Es unterstützt Englisch, Japanisch, Chinesisch, Französisch und Deutsch. Es bietet Kontrolle über Sprechgeschwindigkeit, Tonhöhe, Audioqualität und Emotionen. Laut Zyphria läuft Zonos auf einer RTX 4090 GPU schneller als in Echtzeit. Es verfügt über eine benutzerfreundliche Gradio-Oberfläche und lässt sich mit Docker einfach installieren und einsetzen. Das Modell wurde mit ca. 200.000 Stunden hauptsächlich englischsprachiger Sprachdaten trainiert und ist in zwei Varianten verfügbar: Ein reines Transformer-Modell und ein hybrides Modell, das State-Space-Modelle mit Transformern kombiniert. Zonos kann außerdem im Zyphra-Playground oder via API aufgerufen werden.

Anzeige
Anzeige
Anzeige
Anzeige
Short

OpenAI erweitert seinen Editor Canvas in ChatGPT um eine Sharing-Funktion. Nutzer können ihre Canvas-Projekte nun mit anderen teilen, die diese einsehen, damit interagieren und bearbeiten können. Canvas ermöglicht es Nutzern, gemeinsam mit ChatGPT an Texten und Code zu arbeiten. Der Editor bietet spezielle Funktionen für Schreib- und Coding-Projekte, darunter einen Python-Emulator zur Code-Ausführung im Browser sowie Echtzeit-Feedback und Verbesserungsvorschläge durch die KI. Erst kürzlich hatte OpenAI Canvas für alle Web-Nutzer freigegeben und in die ChatGPT-Desktop-App für macOS integriert.

Google News