OpenAI veröffentlicht neue Modelle für seine Realtime API
OpenAI aktualisiert die Realtime API mit drei neuen Modell-Snapshots für Transkription, Sprachsynthese und Steuerung. Die Variante gpt-4o-mini-transcribe soll laut den Entwicklern weniger Inhalte erfinden. Für die Text-zu-Sprache-Ausgabe senkt gpt-4o-mini-tts die Wortfehlerrate um 35 Prozent. Das für Sprachassistenten relevante Modell gpt-realtime-mini setzt Anweisungen laut Messungen um 22 Prozent genauer um und verbessert Funktionsaufrufe um 13 Prozent.
🆕 New audio model snapshots are now live in the Realtime API with improvements to reliability, lower error rates, and fewer hallucinations:
- gpt-4o-mini-transcribe-2025-12-15: 89% reduction in hallucinations compared to whisper-1
- gpt-4o-mini-tts-2025-12-15: 35% fewer word… pic.twitter.com/E8clreR1R0
— OpenAI Developers (@OpenAIDevs) December 15, 2025
OpenAI nennt außerdem explizit Verbesserungen für Chinesisch, Japanisch, Indonesisch, Hindi, Bengali und Italienisch. Die Modelle sind ab sofort nutzbar.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnieren