Short
Das KI-Startup ElevenLabs hat mit Flash ein neues ultraschnelles Sprachsynthese-Modell vorgestellt. Flash erzeugt Sprache in nur 75 Millisekunden plus Anwendungs- und Netzwerklatenz. Das Modell eignet sich besonders für Echtzeit-Sprachagenten mit geringer Latenz. Es ist in der Conversational AI Plattform von ElevenLabs sowie über die API mit den IDs "eleven_flash_v2" und "eleven_flash_v2_5" verfügbar. Flash v2 unterstützt nur Englisch, v2.5 hingegen 32 Sprachen. Beide Modelle kosten 1 Credit pro 2 Zeichen. Laut ElevenLabs übertrifft Flash in Blindtests vergleichbare Modelle mit ultraniedriger Latenz. Die Audioqualität und emotionale Tiefe liegt etwas unter den langsameren Turbo-Modellen.