Das Open-Source-Sprachmodell Kokoro wurde auf HuggingFace veröffentlicht. Mit 82 Millionen Parametern kann es Stimmen erzeugen, die an das Niveau kommerzieller Anbieter wie Eleven Labs heranreichen, wie die Ergebnisse der TTS Spaces Arena zeigen. Kokoro unterstützt amerikanisches und britisches Englisch und wurde mit weniger als 100 Stunden Audiomaterial trainiert. Aktuell sind 10 Stimmen verfügbar. Es hat aber Einschränkungen, wie fehlende Stimmklon-Fähigkeiten und weitere Sprachen sind bisher nicht geplant. Der Quellcode für die Inferenz steht unter MIT-Lizenz zur Verfügung, während das Modell selbst unter Apache 2.0 lizenziert ist.
Now that we have amazing open source TTS with fast inference, what are you building?https://t.co/XTsRwtiq0Q pic.twitter.com/R7HrtB1LeJ
— Victor M (@victormustar) January 13, 2025
External media content (Twitter) has been blocked here. When loading or playing, connections are established to the servers of the respective providers. Personal data may be communicated to the providers in the process. You can find more information in our privacy policy.
Das französische KI-Start-up Mistral hat sein Code-Modell Codestral aktualisiert. Die neue Version 25.01 generiert und vervollständigt Code laut Mistral doppelt so schnell wie die Vorgängerversion und unterstützt mehr als 80 Programmiersprachen. Laut Benchmarks übertrifft Codestral 25.01 bei fill-in-the-middle (FIM) Aufgaben andere Code-Modelle unter 100 Milliarden Parametern. In der Copilot Arena von LMsys belegt das Modell derzeit den zweiten Platz hinter Sonnet 3.5 und Deepseek V2.5. Codestral 25.01 ist ab sofort über die IDE-Partner von Mistral AI sowie über die APIs von Mistral, Google, Microsoft und Amazon verfügbar. Für Unternehmenskunden bietet das Start-up Continue exklusiv einen lokalen Einsatz an. Kostenlos testen kann man Codestral bei VS Code oder JetBrains.