Nvidia will mit Künstlicher Intelligenz eure Videokonferenzen verbessern. Dafür müsst ihr hinnehmen, dass euer Gesicht digital interpretiert wird.
Viele von uns hängen seit Monaten eine Videokonferenz an die nächste. Nicht alle davon machen Spaß. Die typischen Stolperfallen für maximale Augenroll-Gymnastik während des Calls sind: schlechtes Bild, Streaming-Aussetzer, bescheidene Ausleuchtung und fieser Ton mit nervigen Hintergrundgeräuschen.
Mit der Cloud-KI-Plattform "Maxine" will Nvidia zumindest die visuellen Probleme bei Videokonferenzen wegberechnen. Videokonferenz-Anbieter wie Microsoft mit Skype und Teams oder Zoom sollen sie nutzen, derzeit ist sie nur bei Avaya im Einsatz.
Der potenzielle Markt ist riesig: Täglich werden laut Nvidia rund 30 Millionen Videokonferenzen abgehalten, die Maxine optimieren könnte.
Maxine denkt sich euer Gesicht neu aus und justiert die Blickrichtung
Beim Streaming soll Maxine insbesondere den Traffic-Verbrauch von Videokonferenzen reduzieren, und das signifikant: Nvidia verspricht, dass der H.264-Standard über Maxine nur mehr ein Zehntel der gewohnten Bandbreite benötigt - bei einem besseren Ergebnis.
Für die massive Dateneinsparung verwendet Nvidia die von Deepfakes bekannte GAN-Technologie (Geschichte): Das Video-Streaming überträgt nur mehr die wichtigsten Punkte eines Gesichts, die restlichen Pixel und Bewegungen werden laut Nvidia von der Cloud-KI "intelligent reanimiert".
Bei der KI-Animation kann Maxine die Blickrichtung und sogar die Kopfhaltung der Videokonferenzteilnehmer automatisch auf die Bildmitte ausrichten, auch wenn diese eigentlich direkt in die Kamera oder daran vorbeischauen. Durch diese KI-gestützte Blickjustierung, die zum Beispiel auch Apple bei Facetime anbietet, soll bei Videokonferenzteilnehmern der Eindruck entstehen, dass sie sich gegenseitig in die Augen schauen und Blickkontakt halten können, anstatt aneinander vorbeizustarren.
Damit nicht genug: Schlecht aufgelöste Webcam-Bilder will Nvidia mit schon bewährtem KI-Upscaling in Echtzeit auf HD-Niveau bringen. Wer sein Gesicht lieber gar nicht erst in die Kamera halten will, kann optional in einen mit euren Gesichtszügen animierten Avatar-Kopf schlüpfen.
KI-Entwickler und Anbieter von Videokonferenz-Software können sich bei Nvidia auf ein Early-Access-Programm für Maxine bewerben. Laut Nvidia können Entwickler auch Features hinzufügen, die Hintergrundgeräusche rausfiltern.