Inhalt
newsletter Newsletter

Googles neuester KI-Streich füllt Audiolücken in Videotelefonaten, um abgehackte Internetgespräche zu verhindern. Allerdings muss man damit leben, dass ein Teil der eigenen Stimme unbemerkt durch eine KI moduliert wird.

Anzeige

Google ist bekannt für den breiten Einsatz von KI-Technologie in den hauseigenen Apps. Google Lens lässt Kameras Objekte erkennen, Gmail versucht, E-Mails zu vervollständigen, Google Soli lernt mit Bewegungsdaten neue Radargesten und der KI-Assistent Google Assistant ist das Herzstück von Googles Smartphones und Smartspeakern.

Nun wendet sich Google der eigenen Videotelefonie-App Duo zu: Eine Künstliche Intelligenz soll die Audioqualität eurer Gespräche verbessern.

Mit KI gegen Audiolücken

Die WaveNetEQ genannte Audio-KI springt ein, wenn zwischen zwei Anrufern keine stabile Verbindung aufrechterhalten werden kann. In 99 Prozent aller Duo-Anrufe sei das der Fall, schreibt Google.

Anzeige
Anzeige

Von diesen 99 Prozent verlören 20 Prozent über drei Prozent der Audioübertragung, zehn Prozent sogar über acht Prozent. Damit der Telefonanruf nicht zur reinsten Stotterpartie verkommt, setzt Google, wie auch andere Anbieter, bereits eine Software ein, die diese Fehler auditiv verschleiert.

Googles KI-gestützte WaveNetEQ soll diese alte Lösung (NetEQ) qualitativ hochwertig ersetzen und bis zu 120 Millisekunden lange Audiolücken auffüllen.

Wenn also die eigene Stimme aussetzt, ergänzt die KI blitzschnell passende Stimmgeräusche. Dadurch ergibt sich ein homogener Höreindruck, bei dem die eigene Stimme aber nicht mehr vollständig aus dem eigenen Mund kommt, sondern teils maschinell erzeugt wird.

60ms Verlust

NetEQ (alte Methode)

WaveNetEQ

Empfehlung

NetEQ (alte Methode)

WaveNetEQ

120ms Verlust

NetEQ (alte Methode)

WaveNetEQ

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

NetEQ (alte Methode)

WaveNetEQ

WaveNetEO ist für Pixel-Smartphones schon verfügbar

WaveNetEQ wurde mit über 100 Sprechern in 48 verschiedenen Sprachen trainiert und läuft lokal auf Smartphones. Aktuell ergänzt die KI einzelne Silben in der Tonlage des Sprechers. Ganze Wörter kann die KI noch nicht ersetzen - bei Lücken länger als 120ms bleibt WaveNetEQ daher stumm.

Die Audio-KI ist bereits für Duo-Anrufe auf Googles Pixel 4 Smartphones verfügbar und soll nun auf andere Modelle ausgeweitet werden. Welche das sind, verrät Google nicht.

Quelle: Google

Weiterlesen über Künstliche Intelligenz:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!