Inhalt
newsletter Newsletter

Vom durch Corona ausgelösten Digital-Boost profitiert auch die KI-Branche. Das zeigt sich am Beispiel von Videokonferenz-Software.

Anzeige

Mitte April zeigte Microsoft, wie es bei Teams einen großen Videokonferenz-Nervfaktor mit KI beseitigen will: Ein neuronales Netz wird mit mehr als 100 Störgeräuschen trainiert, ein zweites mit den Stimmen tausender Sprecher.

Anschließend kombiniert Microsoft die beiden neuronalen Netze und trainiert das daraus resultierende KI-Modell darauf, Lärm und Stimme sauber voneinander zu trennen - unabhängig von einzelnen Sprecherstimmen. Das folgende Video zeigt das System im Einsatz.

Was Microsoft bei Künstlicher Intelligenz kann, schafft natürlich auch Google. Für die eigene Videokonferenz-Software Google Meet stellt Google jetzt zwei neue KI-gestützte Funktionen vor.

Anzeige
Anzeige

Eine davon ist ebenfalls eine Lärmunterdrückung, die sogar an einem lauten Flughafen noch gut verstehbare Gespräche ohne Headset ermöglichen soll.

Falls die Funktion tatsächlich so gut funktioniert, wie im Video demonstriert, dürften störende Nebengeräusche bei Videokonferenzen wohl endgültig eine Sache der Vergangenheit sein.

Die KI-Lärmunterdrückung rollt laut Google in den kommenden Wochen für Kunden der "G Suite Enterprise" und "G Suite Enterprise for Education" aus - zuerst für das Web, anschließend für mobile Geräte.

Die zweite neue Funktion betrifft das Videobild: Google hat laut eigenen Angaben ein KI-Verfahren entwickelt, das schlecht ausgeleuchtete Räume automatisch aufhellt. Bye bye, unbedarfte Videokonferenz-Nutzer in ungünstigen Lichtsituationen.

Die KI-Beleuchtung rollt derzeit für mobile Geräte aus. Google Meet im Web soll in der Zukunft folgen. Wahrscheinlich sind in Smartphones im Schnitt hochwertigere Kameras verbaut als bei Webcams für den PC, sodass die Bildanalyse-KI mobil einen leichteren Job hat.

Empfehlung

Zoom bekommt KI-gestützte Transkription

Als besonders nützlich könnte sich Zooms neueste KI-Integration erweisen: Otter.ai ist eine Web-Applikation, die Sprache in Echtzeit als Text mitschreibt.

Teilnehmer einer Videokonferenz können die Mitschrift parallel zum Meeting lesen und bearbeiten. Das erleichtert die Protokollarbeit.

Trainiert wurde die Otter-KI mit Millionen Stunden an Audioaufnahmen - leider bislang nur in englischer Sprache. Im folgenden Video könnt ihr die Echtzeit-Transkription im Einsatz sehen.

Um Otter für Zoom zu nutzen, ist ein bezahlter Otter-Account und mindestens ein Zoom-Pro-Account notwendig. Verknüpft man die beiden Accounts, erscheint in Zoom-Meetings anschließend ein Button für die Live-Transkription.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Microsoft Teams (Cloud recording) und Google Meet (tactiq) bieten ebenfalls KI-gestützte Echtzeit-Transkriptionen und -Untertitel an.

Weiterlesen über Künstliche Intelligenz:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!