Künstliche Intelligenz

Nvidia: Neue Videokonferenz-KI verdreht euch den Kopf

Matthias Bastian
Ein Gesicht wird mit KI automatisch so ausgerichtet, dass es in die Kamera schaut.

Nvidia will mit Künstlicher Intelligenz eure Videokonferenzen verbessern. Dafür müsst ihr hinnehmen, dass euer Gesicht digital interpretiert wird.

Viele von uns hängen seit Monaten eine Videokonferenz an die nächste. Nicht alle davon machen Spaß. Die typischen Stolperfallen für maximale Augenroll-Gymnastik während des Calls sind: schlechtes Bild, Streaming-Aussetzer, bescheidene Ausleuchtung und fieser Ton mit nervigen Hintergrundgeräuschen.

Mit der Cloud-KI-Plattform "Maxine" will Nvidia zumindest die visuellen Probleme bei Videokonferenzen wegberechnen. Videokonferenz-Anbieter wie Microsoft mit Skype und Teams oder Zoom sollen sie nutzen, derzeit ist sie nur bei Avaya im Einsatz.

Der potenzielle Markt ist riesig: Täglich werden laut Nvidia rund 30 Millionen Videokonferenzen abgehalten, die Maxine optimieren könnte.

Mit KI will Nvidia gängige visuelle Probleme bei Videokonferenzen lösen. Dafür kommt die von Deepfakes bekannte GAN-Technologie zum Einsatz. Der Konzern richtet sich mit der Cloud-KI Maxine direkt an Anbieter von Videokonferenz-Software. | Bild: Nvidia

Maxine denkt sich euer Gesicht neu aus und justiert die Blickrichtung

Beim Streaming soll Maxine insbesondere den Traffic-Verbrauch von Videokonferenzen reduzieren, und das signifikant: Nvidia verspricht, dass der H.264-Standard über Maxine nur mehr ein Zehntel der gewohnten Bandbreite benötigt - bei einem besseren Ergebnis.

Für die massive Dateneinsparung verwendet Nvidia die von Deepfakes bekannte GAN-Technologie (Geschichte): Das Video-Streaming überträgt nur mehr die wichtigsten Punkte eines Gesichts, die restlichen Pixel und Bewegungen werden laut Nvidia von der Cloud-KI "intelligent reanimiert".

Bei der KI-Animation kann Maxine die Blickrichtung und sogar die Kopfhaltung der Videokonferenzteilnehmer automatisch auf die Bildmitte ausrichten, auch wenn diese eigentlich direkt in die Kamera oder daran vorbeischauen. Durch diese KI-gestützte Blickjustierung, die zum Beispiel auch Apple bei Facetime anbietet, soll bei Videokonferenzteilnehmern der Eindruck entstehen, dass sie sich gegenseitig in die Augen schauen und Blickkontakt halten können, anstatt aneinander vorbeizustarren.

Deepfake-Fortschritt macht's möglich: Eine Nvidia-KI dreht das Gesicht eines Videokonferenzteilnehmers automatisch in Richtung Bildmitte, auch wen der eigentlich seitlich an der Kamera vorbeischaut. | Bild: Nvidia

Damit nicht genug: Schlecht aufgelöste Webcam-Bilder will Nvidia mit schon bewährtem KI-Upscaling in Echtzeit auf HD-Niveau bringen. Wer sein Gesicht lieber gar nicht erst in die Kamera halten will, kann optional in einen mit euren Gesichtszügen animierten Avatar-Kopf schlüpfen.

KI-Entwickler und Anbieter von Videokonferenz-Software können sich bei Nvidia auf ein Early-Access-Programm für Maxine bewerben. Laut Nvidia können Entwickler auch Features hinzufügen, die Hintergrundgeräusche rausfiltern.

Weiterlesen über Künstliche Intelligenz: