Google KI ergänzt eure Stimme - und niemand merkt's

5. April 2020

Googles neuester KI-Streich füllt Audiolücken in Videotelefonaten, um abgehackte Internetgespräche zu verhindern. Allerdings muss man damit leben, dass ein Teil der eigenen Stimme unbemerkt durch eine KI moduliert wird.

Google ist bekannt für den breiten Einsatz von KI-Technologie in den hauseigenen Apps. Google Lens lässt Kameras Objekte erkennen, Gmail versucht, E-Mails zu vervollständigen, Google Soli lernt mit Bewegungsdaten neue Radargesten und der KI-Assistent Google Assistant ist das Herzstück von Googles Smartphones und Smartspeakern.

Nun wendet sich Google der eigenen Videotelefonie-App Duo zu: Eine Künstliche Intelligenz soll die Audioqualität eurer Gespräche verbessern.

Mit KI gegen Audiolücken

Die WaveNetEQ genannte Audio-KI springt ein, wenn zwischen zwei Anrufern keine stabile Verbindung aufrechterhalten werden kann. In 99 Prozent aller Duo-Anrufe sei das der Fall, schreibt Google.

Von diesen 99 Prozent verlören 20 Prozent über drei Prozent der Audioübertragung, zehn Prozent sogar über acht Prozent. Damit der Telefonanruf nicht zur reinsten Stotterpartie verkommt, setzt Google, wie auch andere Anbieter, bereits eine Software ein, die diese Fehler auditiv verschleiert.

Googles KI-gestützte WaveNetEQ soll diese alte Lösung (NetEQ) qualitativ hochwertig ersetzen und bis zu 120 Millisekunden lange Audiolücken auffüllen.

Wenn also die eigene Stimme aussetzt, ergänzt die KI blitzschnell passende Stimmgeräusche. Dadurch ergibt sich ein homogener Höreindruck, bei dem die eigene Stimme aber nicht mehr vollständig aus dem eigenen Mund kommt, sondern teils maschinell erzeugt wird.

60ms Verlust

NetEQ (alte Methode)

WaveNetEQ

NetEQ (alte Methode)

WaveNetEQ

120ms Verlust

NetEQ (alte Methode)

WaveNetEQ

NetEQ (alte Methode)

WaveNetEQ

WaveNetEO ist für Pixel-Smartphones schon verfügbar

WaveNetEQ wurde mit über 100 Sprechern in 48 verschiedenen Sprachen trainiert und läuft lokal auf Smartphones. Aktuell ergänzt die KI einzelne Silben in der Tonlage des Sprechers. Ganze Wörter kann die KI noch nicht ersetzen - bei Lücken länger als 120ms bleibt WaveNetEQ daher stumm.

Die Audio-KI ist bereits für Duo-Anrufe auf Googles Pixel 4 Smartphones verfügbar und soll nun auf andere Modelle ausgeweitet werden. Welche das sind, verrät Google nicht.

Quelle: Google

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 16 % Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: “KI Radar” – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Google KI ergänzt eure Stimme - und niemand merkt's

Mit KI gegen Audiolücken

60ms Verlust

120ms Verlust

WaveNetEO ist für Pixel-Smartphones schon verfügbar

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.