Meta hat den MMCSG-Datensatz (Multi-Modal Conversations in Smart Glasses) veröffentlicht, der zweiseitige Gespräche enthält, die mit Aria-Brillen aufgezeichnet wurden. Der Datensatz enthält Mehrkanal-Audio-, Video-, Beschleunigungsmesser- und Gyroskopdaten und soll die Forschung in Bereichen wie automatische Spracherkennung, Aktivitätserkennung und Sprechertagebuch unterstützen. Die Brille erfasst Video- und Audiodaten mit sieben Mikrofonen sowie Messungen der Inertialmesseinheit (IMU). Alle Daten wurden von einwilligenden Teilnehmern erhoben und zur Wahrung der Privatsphäre anonymisiert. Der MMCSG-Datensatz könnte für Anwendungen wie Sprachübersetzung in Echtzeit verwendet werden. Weitere Informationen finden Sie in dem zugehörigen Forschungspapier, und der Datensatz steht unter der Meta-Datenlizenz zum Download bereit.
Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Quellen
News, Tests und Berichte über VR, AR und MIXED Reality.
RTX 5070 Ti: Alle Details zur neuen Grafikkarte und ihrem Release
Plastiktruppen marschieren in die Meta Quest Charts ein
XR-Wochenrückblick: PSVR 2 Handtracking überrascht, Civilization 7 kommt für Quest 3 und Gothic VR-Projekt begeistert
MIXED.de
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!