Anzeige
Skip to content

Google bereitet wohl native Audio-Fähigkeiten für Gemini 3 Flash mit Stimmenklonen vor

Google arbeitet an einer Funktion, mit der Nutzer ihre eigene Stimme in AI Studio klonen können. Eine versteckte Option namens "Create Your Voice" erscheint laut TestingCatalog bei der Auswahl des "Flash Native Audio Preview"-Modells, das derzeit mit Gemini 2.5 Flash verbunden ist. Bei Auswahl öffnet sich ein Fenster zum Aufnehmen und Hochladen von Audio, die Funktion ist aber noch nicht aktiv. Die Entdeckung deutet darauf hin, dass Google native Audio-Fähigkeiten für Gemini 3 Flash vorbereitet. Damit könnten Entwickler künstliche Stimmen erzeugen, die auf aufgenommenen Sprachproben basieren. Google hatte erst im Dezember 2025 ein Update für Gemini 2.5 Flash Native Audio veröffentlicht, das die Sprachqualität verbesserte und Anweisungen präziser umsetzt.

Screenshot von Google AI Studio im Playground-Modus. Rechts in der Seitenleiste ist unter der Stimmauswahl "Zephyr" ein Button mit der Aufschrift "Create your voice" zu sehen, auf den ein roter Pfeil zeigt. Oben rechts steht die Modellbezeichnung Gemini 2.5 Flash Native Audio Preview.
Die versteckte Option "Create your voice" in Google AI Studio deutet auf kommende Funktionen zum Klonen von Stimmen hin.

Zusätzlich wurde eine neue Option gefunden, mit der sich ganze Code-Sammlungen über GitHub-Repositories importieren lassen. Auch die Startseite wird allem Anschein nach überarbeitet und zeigt künftig Aktivitäten und Nutzungsstatistiken getrennt an.

Anzeige
DEC_D_Incontent-1

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: TestingCatalog