Meta hat den MMCSG-Datensatz (Multi-Modal Conversations in Smart Glasses) veröffentlicht, der zweiseitige Gespräche enthält, die mit Aria-Brillen aufgezeichnet wurden. Der Datensatz enthält Mehrkanal-Audio-, Video-, Beschleunigungsmesser- und Gyroskopdaten und soll die Forschung in Bereichen wie automatische Spracherkennung, Aktivitätserkennung und Sprechertagebuch unterstützen. Die Brille erfasst Video- und Audiodaten mit sieben Mikrofonen sowie Messungen der Inertialmesseinheit (IMU). Alle Daten wurden von einwilligenden Teilnehmern erhoben und zur Wahrung der Privatsphäre anonymisiert. Der MMCSG-Datensatz könnte für Anwendungen wie Sprachübersetzung in Echtzeit verwendet werden. Weitere Informationen finden Sie in dem zugehörigen Forschungspapier, und der Datensatz steht unter der Meta-Datenlizenz zum Download bereit.
Metas Aria Smart Glasses Datensatz hilft, die Zukunft von KI-Gesprächen zu gestalten
Quellen: