Meta hat den MMCSG-Datensatz (Multi-Modal Conversations in Smart Glasses) veröffentlicht, der zweiseitige Gespräche enthält, die mit Aria-Brillen aufgezeichnet wurden. Der Datensatz enthält Mehrkanal-Audio-, Video-, Beschleunigungsmesser- und Gyroskopdaten und soll die Forschung in Bereichen wie automatische Spracherkennung, Aktivitätserkennung und Sprechertagebuch unterstützen. Die Brille erfasst Video- und Audiodaten mit sieben Mikrofonen sowie Messungen der Inertialmesseinheit (IMU). Alle Daten wurden von einwilligenden Teilnehmern erhoben und zur Wahrung der Privatsphäre anonymisiert. Der MMCSG-Datensatz könnte für Anwendungen wie Sprachübersetzung in Echtzeit verwendet werden. Weitere Informationen finden Sie in dem zugehörigen Forschungspapier, und der Datensatz steht unter der Meta-Datenlizenz zum Download bereit.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!