Meta hat den MMCSG-Datensatz (Multi-Modal Conversations in Smart Glasses) veröffentlicht, der zweiseitige Gespräche enthält, die mit Aria-Brillen aufgezeichnet wurden. Der Datensatz enthält Mehrkanal-Audio-, Video-, Beschleunigungsmesser- und Gyroskopdaten und soll die Forschung in Bereichen wie automatische Spracherkennung, Aktivitätserkennung und Sprechertagebuch unterstützen. Die Brille erfasst Video- und Audiodaten mit sieben Mikrofonen sowie Messungen der Inertialmesseinheit (IMU). Alle Daten wurden von einwilligenden Teilnehmern erhoben und zur Wahrung der Privatsphäre anonymisiert. Der MMCSG-Datensatz könnte für Anwendungen wie Sprachübersetzung in Echtzeit verwendet werden. Weitere Informationen finden Sie in dem zugehörigen Forschungspapier, und der Datensatz steht unter der Meta-Datenlizenz zum Download bereit.
Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Quellen
News, Tests und Berichte über VR, AR und MIXED Reality.
Cyberpunk 2077, Elden Ring und mehr: VR-Mods jetzt deutlich schöner mit DLSS
Quest Games Optimizer: Update reicht wichtiges Feature nach
8 VR-Spiele, auf die man sich im Januar 2025 freuen darf
MIXED.de
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!