Nvidia: Neue Videokonferenz-KI verdreht euch den Kopf

6. Oktober 2020

Nvidia will mit Künstlicher Intelligenz eure Videokonferenzen verbessern. Dafür müsst ihr hinnehmen, dass euer Gesicht digital interpretiert wird.

Viele von uns hängen seit Monaten eine Videokonferenz an die nächste. Nicht alle davon machen Spaß. Die typischen Stolperfallen für maximale Augenroll-Gymnastik während des Calls sind: schlechtes Bild, Streaming-Aussetzer, bescheidene Ausleuchtung und fieser Ton mit nervigen Hintergrundgeräuschen.

Mit der Cloud-KI-Plattform "Maxine" will Nvidia zumindest die visuellen Probleme bei Videokonferenzen wegberechnen. Videokonferenz-Anbieter wie Microsoft mit Skype und Teams oder Zoom sollen sie nutzen, derzeit ist sie nur bei Avaya im Einsatz.

Der potenzielle Markt ist riesig: Täglich werden laut Nvidia rund 30 Millionen Videokonferenzen abgehalten, die Maxine optimieren könnte.

Mit KI will Nvidia gängige visuelle Probleme bei Videokonferenzen lösen. Der Konzern richtet sich mit der Cloud-KI Maxine direkt an Anbieter von Videokonferenz-Software. | Bild: Nvidia — Mit KI will Nvidia gängige visuelle Probleme bei Videokonferenzen lösen. Dafür kommt die von Deepfakes bekannte GAN-Technologie zum Einsatz. Der Konzern richtet sich mit der Cloud-KI Maxine direkt an Anbieter von Videokonferenz-Software. | Bild: Nvidia

Maxine denkt sich euer Gesicht neu aus und justiert die Blickrichtung

Beim Streaming soll Maxine insbesondere den Traffic-Verbrauch von Videokonferenzen reduzieren, und das signifikant: Nvidia verspricht, dass der H.264-Standard über Maxine nur mehr ein Zehntel der gewohnten Bandbreite benötigt - bei einem besseren Ergebnis.

Für die massive Dateneinsparung verwendet Nvidia die von Deepfakes bekannte GAN-Technologie (Geschichte): Das Video-Streaming überträgt nur mehr die wichtigsten Punkte eines Gesichts, die restlichen Pixel und Bewegungen werden laut Nvidia von der Cloud-KI "intelligent reanimiert".

Bei der KI-Animation kann Maxine die Blickrichtung und sogar die Kopfhaltung der Videokonferenzteilnehmer automatisch auf die Bildmitte ausrichten, auch wenn diese eigentlich direkt in die Kamera oder daran vorbeischauen. Durch diese KI-gestützte Blickjustierung, die zum Beispiel auch Apple bei Facetime anbietet, soll bei Videokonferenzteilnehmern der Eindruck entstehen, dass sie sich gegenseitig in die Augen schauen und Blickkontakt halten können, anstatt aneinander vorbeizustarren.

Ein Gesicht wird mit KI automatisch so ausgerichtet, dass es in die Kamera schaut. — Deepfake-Fortschritt macht's möglich: Eine Nvidia-KI dreht das Gesicht eines Videokonferenzteilnehmers automatisch in Richtung Bildmitte, auch wen der eigentlich seitlich an der Kamera vorbeischaut. | Bild: Nvidia

Damit nicht genug: Schlecht aufgelöste Webcam-Bilder will Nvidia mit schon bewährtem KI-Upscaling in Echtzeit auf HD-Niveau bringen. Wer sein Gesicht lieber gar nicht erst in die Kamera halten will, kann optional in einen mit euren Gesichtszügen animierten Avatar-Kopf schlüpfen.

KI-Entwickler und Anbieter von Videokonferenz-Software können sich bei Nvidia auf ein Early-Access-Programm für Maxine bewerben. Laut Nvidia können Entwickler auch Features hinzufügen, die Hintergrundgeräusche rausfiltern.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Nvidia: Neue Videokonferenz-KI verdreht euch den Kopf

Maxine denkt sich euer Gesicht neu aus und justiert die Blickrichtung

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.