Anzeige
Skip to content

Cohere veröffentlicht neues Open-Source-Modell zur automatischen Spracherkennung

Das kanadische KI-Unternehmen Cohere hat mit "Transcribe" ein neues Open-Source-Modell zur automatischen Spracherkennung veröffentlicht. Das Modell belegt laut Cohere Platz 1 auf dem HuggingFace Open ASR Leaderboard mit einer durchschnittlichen Wortfehlerrate von nur 5,42 Prozent. Damit übertrifft es Konkurrenten wie OpenAIs Whisper Large v3, ElevenLabs Scribe v2 und Qwen3-ASR-1.7B. Neben hoher Genauigkeit bietet Transcribe laut Cohere auch den besten Durchsatz unter vergleichbar großen Modellen.

Die Grafik zeigt den Vergleich von sieben Spracherkennungsmodellen mit mehr als einer Milliarde Parametern. Auf der x-Achse ist die Genauigkeit als Wortfehlerrate (WER) abgetragen, wobei niedrigere Werte besser sind. Die y-Achse zeigt den Durchsatz (RTFx), also wie schnell ein Modell Audio im Verhältnis zur Echtzeit verarbeitet. Cohere Transcribe liegt mit einem RTFx von 525 und einer WER von etwa 5,4 oben links und ist damit sowohl das schnellste als auch das genaueste Modell. NVIDIA Canary Qwen 2.5B folgt mit einem RTFx von 418. Modelle wie OpenAIs Whisper Large v3 und Voxtral Realtime sind deutlich langsamer und ungenauer.
Cohere Transcribe im Vergleich mit sieben anderen Spracherkennungsmodellen: Je weiter oben links ein Modell liegt, desto besser ist es: also schneller (hoher Durchsatz) und genauer (niedrige Wortfehlerrate). | Bild: Cohere

Das 2-Milliarden-Parameter-Modell unterstützt 14 Sprachen, darunter Englisch, Deutsch, Französisch und Japanisch. Es steht unter der Apache-2.0-Lizenz auf Hugging Face zum Download bereit und ist auch über Coheres API sowie die Plattform Model Vault nutzbar. Cohere plant, Transcribe künftig in seine KI-Agenten-Plattform North zu integrieren.

Anzeige
DEC_D_Incontent-1

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: Cohere