Anzeige
Skip to content

Gemini 3.1 Flash Live: Google zeigt neues KI-Modell für natürlichere Sprachdialoge

Google hat Gemini 3.1 Flash Live vorgestellt, sein bisher bestes Sprach- und Audio-KI-Modell. Es bietet laut Google schnellere Antworten, natürlichere Gespräche und konfigurierbare Denkstufen für Entwickler. Es soll zudem Tonlagen und Emotionen besser erkennen und in lauten Umgebungen zuverlässiger arbeiten. Das Modell ist auch das neue Dialogmodell für den Live-Modus in der Gemini-App.

Laut Artificial Analysis erreicht das Modell auf der Denkstufe "High" 95,9 Prozent im Big Bench Audio Benchmark, Platz zwei hinter Step-Audio R1.1 Realtime (97,0 Prozent). Die Antwortzeit liegt bei 2,98 Sekunden. Auf der Stufe "Minimal" sinkt die Qualität auf 70,5 Prozent, die Antwortzeit verbessert sich aber auf 0,96 Sekunden.

Gemini 3.1 Flash Live erreicht mit hoher Denkstufe 95,9 Prozent im Big Bench Audio Benchmark und liegt damit auf Platz zwei hinter Step-Audio R1.1 Realtime. | Bild: Artificial Analysis

Gemini 3.1 Flash Live ist über die Gemini-Live-APIGoogle AI Studio, Gemini Live und Search Live in mehr als 200 Ländern verfügbar. Die Preise bleiben bei 0,35 Dollar pro Stunde Audio-Eingabe und 1,40 Dollar pro Stunde Audio-Ausgabe auf dem Niveau des Gemini-2.5-Vorgängermodells. Damit gehört es zu den günstigsten Audio-KI-Modellen am Markt, das etwas besser bewertete Step-Audio-Modell ist aber insgesamt noch etwas günstiger.

Anzeige
DEC_D_Incontent-1

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: Google