Anzeige
Skip to content

OpenAI veröffentlicht neue Modelle für seine Realtime API

OpenAI aktualisiert die Realtime API mit drei neuen Modell-Snapshots für Transkription, Sprachsynthese und Steuerung. Die Variante gpt-4o-mini-transcribe soll laut den Entwicklern weniger Inhalte erfinden. Für die Text-zu-Sprache-Ausgabe senkt gpt-4o-mini-tts die Wortfehlerrate um 35 Prozent. Das für Sprachassistenten relevante Modell gpt-realtime-mini setzt Anweisungen laut Messungen um 22 Prozent genauer um und verbessert Funktionsaufrufe um 13 Prozent.

OpenAI nennt außerdem explizit Verbesserungen für Chinesisch, Japanisch, Indonesisch, Hindi, Bengali und Italienisch. Die Modelle sind ab sofort nutzbar.

Anzeige
DEC_D_Incontent-2

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.