KI in der Praxis

Google KI ergänzt eure Stimme - und niemand merkt's

Maximilian Schreiner
Google KI ergänzt eure Stimme - und niemand merkt's

Googles neuester KI-Streich füllt Audiolücken in Videotelefonaten, um abgehackte Internetgespräche zu verhindern. Allerdings muss man damit leben, dass ein Teil der eigenen Stimme unbemerkt durch eine KI moduliert wird.

Google ist bekannt für den breiten Einsatz von KI-Technologie in den hauseigenen Apps. Google Lens lässt Kameras Objekte erkennen, Gmail versucht, E-Mails zu vervollständigen, Google Soli lernt mit Bewegungsdaten neue Radargesten und der KI-Assistent Google Assistant ist das Herzstück von Googles Smartphones und Smartspeakern.

Nun wendet sich Google der eigenen Videotelefonie-App Duo zu: Eine Künstliche Intelligenz soll die Audioqualität eurer Gespräche verbessern.

Mit KI gegen Audiolücken

Die WaveNetEQ genannte Audio-KI springt ein, wenn zwischen zwei Anrufern keine stabile Verbindung aufrechterhalten werden kann. In 99 Prozent aller Duo-Anrufe sei das der Fall, schreibt Google.

Von diesen 99 Prozent verlören 20 Prozent über drei Prozent der Audioübertragung, zehn Prozent sogar über acht Prozent. Damit der Telefonanruf nicht zur reinsten Stotterpartie verkommt, setzt Google, wie auch andere Anbieter, bereits eine Software ein, die diese Fehler auditiv verschleiert.

Googles KI-gestützte WaveNetEQ soll diese alte Lösung (NetEQ) qualitativ hochwertig ersetzen und bis zu 120 Millisekunden lange Audiolücken auffüllen.

Wenn also die eigene Stimme aussetzt, ergänzt die KI blitzschnell passende Stimmgeräusche. Dadurch ergibt sich ein homogener Höreindruck, bei dem die eigene Stimme aber nicht mehr vollständig aus dem eigenen Mund kommt, sondern teils maschinell erzeugt wird.

60ms Verlust

NetEQ (alte Methode)

https://mixed.de/wp-content/uploads/2020/04/neteq_60_ms_1_f1dfe8dd0c6af457976d6ceffb9cc3d8.mp3?_=1

WaveNetEQ

https://mixed.de/wp-content/uploads/2020/04/waveneteq_60_ms_1_f9d02625c71b668a6234767075cb196f.mp3?_=2

NetEQ (alte Methode)

https://mixed.de/wp-content/uploads/2020/04/neteq_60_ms_2_36d0519b296a64dc538a55aa799697c7.mp3?_=3

WaveNetEQ

https://mixed.de/wp-content/uploads/2020/04/waveneteq_60_ms_2_b2a01d6b1ba35405203bbf430a5675f3.mp3?_=4

120ms Verlust

NetEQ (alte Methode)

https://mixed.de/wp-content/uploads/2020/04/neteq_120_ms_1_f0effd0234b6f9778aab0ff445afc948.mp3?_=5

WaveNetEQ

https://mixed.de/wp-content/uploads/2020/04/waveneteq_120_ms_1_7532342f5800ce52d0a450581816e035.mp3?_=6

NetEQ (alte Methode)

https://mixed.de/wp-content/uploads/2020/04/neteq_120_ms_2_8e86d7b2061dfb964b845ebefc1aebd9.mp3?_=7

WaveNetEQ

https://mixed.de/wp-content/uploads/2020/04/waveneteq_120_ms_2_63b829581a3291c144a030639139c199.mp3?_=8

WaveNetEO ist für Pixel-Smartphones schon verfügbar

WaveNetEQ wurde mit über 100 Sprechern in 48 verschiedenen Sprachen trainiert und läuft lokal auf Smartphones. Aktuell ergänzt die KI einzelne Silben in der Tonlage des Sprechers. Ganze Wörter kann die KI noch nicht ersetzen - bei Lücken länger als 120ms bleibt WaveNetEQ daher stumm.

Die Audio-KI ist bereits für Duo-Anrufe auf Googles Pixel 4 Smartphones verfügbar und soll nun auf andere Modelle ausgeweitet werden. Welche das sind, verrät Google nicht.

Quelle: Google

Weiterlesen über Künstliche Intelligenz: