Inhalt
newsletter Newsletter

Nvidia will mit Künstlicher Intelligenz eure Videokonferenzen verbessern. Dafür müsst ihr hinnehmen, dass euer Gesicht digital interpretiert wird.

Anzeige

Viele von uns hängen seit Monaten eine Videokonferenz an die nächste. Nicht alle davon machen Spaß. Die typischen Stolperfallen für maximale Augenroll-Gymnastik während des Calls sind: schlechtes Bild, Streaming-Aussetzer, bescheidene Ausleuchtung und fieser Ton mit nervigen Hintergrundgeräuschen.

Mit der Cloud-KI-Plattform "Maxine" will Nvidia zumindest die visuellen Probleme bei Videokonferenzen wegberechnen. Videokonferenz-Anbieter wie Microsoft mit Skype und Teams oder Zoom sollen sie nutzen, derzeit ist sie nur bei Avaya im Einsatz.

Der potenzielle Markt ist riesig: Täglich werden laut Nvidia rund 30 Millionen Videokonferenzen abgehalten, die Maxine optimieren könnte.

Anzeige
Anzeige
Mit KI will Nvidia gängige visuelle Probleme bei Videokonferenzen lösen. Der Konzern richtet sich mit der Cloud-KI Maxine direkt an Anbieter von Videokonferenz-Software. | Bild: Nvidia
Mit KI will Nvidia gängige visuelle Probleme bei Videokonferenzen lösen. Dafür kommt die von Deepfakes bekannte GAN-Technologie zum Einsatz. Der Konzern richtet sich mit der Cloud-KI Maxine direkt an Anbieter von Videokonferenz-Software. | Bild: Nvidia

Maxine denkt sich euer Gesicht neu aus und justiert die Blickrichtung

Beim Streaming soll Maxine insbesondere den Traffic-Verbrauch von Videokonferenzen reduzieren, und das signifikant: Nvidia verspricht, dass der H.264-Standard über Maxine nur mehr ein Zehntel der gewohnten Bandbreite benötigt - bei einem besseren Ergebnis.

Für die massive Dateneinsparung verwendet Nvidia die von Deepfakes bekannte GAN-Technologie (Geschichte): Das Video-Streaming überträgt nur mehr die wichtigsten Punkte eines Gesichts, die restlichen Pixel und Bewegungen werden laut Nvidia von der Cloud-KI "intelligent reanimiert".

Bei der KI-Animation kann Maxine die Blickrichtung und sogar die Kopfhaltung der Videokonferenzteilnehmer automatisch auf die Bildmitte ausrichten, auch wenn diese eigentlich direkt in die Kamera oder daran vorbeischauen. Durch diese KI-gestützte Blickjustierung, die zum Beispiel auch Apple bei Facetime anbietet, soll bei Videokonferenzteilnehmern der Eindruck entstehen, dass sie sich gegenseitig in die Augen schauen und Blickkontakt halten können, anstatt aneinander vorbeizustarren.

Ein Gesicht wird mit KI automatisch so ausgerichtet, dass es in die Kamera schaut.
Deepfake-Fortschritt macht's möglich: Eine Nvidia-KI dreht das Gesicht eines Videokonferenzteilnehmers automatisch in Richtung Bildmitte, auch wen der eigentlich seitlich an der Kamera vorbeischaut. | Bild: Nvidia

Damit nicht genug: Schlecht aufgelöste Webcam-Bilder will Nvidia mit schon bewährtem KI-Upscaling in Echtzeit auf HD-Niveau bringen. Wer sein Gesicht lieber gar nicht erst in die Kamera halten will, kann optional in einen mit euren Gesichtszügen animierten Avatar-Kopf schlüpfen.

KI-Entwickler und Anbieter von Videokonferenz-Software können sich bei Nvidia auf ein Early-Access-Programm für Maxine bewerben. Laut Nvidia können Entwickler auch Features hinzufügen, die Hintergrundgeräusche rausfiltern.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung

Weiterlesen über Künstliche Intelligenz:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!