Inhalt
newsletter Newsletter

Die Basis für maschinelle Lernverfahren sind hochwertige Daten. Google stellt einen neuen Datensatz zur Verfügung, mit dem KI-Systeme menschliche Handlungen anhand von kurzen Videoausschnitten erkennen lernen sollen.

Anzeige

Hochwertige und umfangreiche Datensätze sind für maschinelle Lernverfahren wie der Treibstoff für das Auto: Ohne sie geht nichts. Umso mehr Dateneingabe ein KI-System bekommt, desto verlässlicher entwickelt sich die Mustererkennung.

Google veröffentlicht neu eine Sammlung aus 57.600 drei Sekunden kurzen Videos, die 80 verschiedene menschliche Aktivitäten zeigen, darunter typische Handlungen wie eine Umarmung, Händeschütteln, eine Unterhaltung und Lauf- oder Kampfbewegungen. Die kurzen Ausschnitte wurden aus Spielfilmen bei YouTube entnommen.

Jedes Video wird mit einer zusätzlichen Datei ausgeliefert, die die Handlung einer Person oder mehrerer Personen im Video genau beschreibt. Im Mensch-Maschine-Vergleich sind diese Beschreibungen das Äquivalent zu Eltern, die vor ihrem Kleinkind auf eine Katze zeigen und ihm sagen, dass es eine Katze ist.

Anzeige
Anzeige

Vorsicht vor Vorurteilen

Dass die kurzen Videos aus Filmen entnommen wurden, ist die Schwachstelle des Datensatzes. Typischerweise sind die Darbietungen von Schauspielern übertrieben dargestellt. Die Maschine lernt daher nicht mit authentischen Situationen aus dem menschlichen Alltag, sondern anhand der dramatisierten Filmsprache.

Die Forscher räumen die Möglichkeit von Vorurteilen in der begleitenden Publikation ein, betonen allerdings auch, dass die von ihnen getroffene Auswahl besser sei als Maschinen mit von Nutzern generierten Videos zu trainieren.

Bei der Auswahl der kurzen Szenen wurde laut den Google-Forschern darauf geachtet, dass die besten Schauspieler aus verschiedenen Nationen darin zu sehen sind, um keine Vorurteile bezüglich Rasse oder Geschlecht zu vermitteln.

Die ultimative Videosuchmaschine?

Das Ziel der Forscher ist es, dass ein KI-System anhand der Videos eine soziale visuelle Intelligenz entwickelt, mit der es menschliche Handlung identifizieren, vorhersehen und ihre Zielsetzung verstehen kann.

Klar ist auch, dass Google für so einen fortschrittlichen Algorithmus ein sehr konkretes Anwendungsszenario hätte: Eine Suchfunktion für YouTube, die sich nicht an den Verschlagwortungen der Nutzer orientieren muss, sondern passend zur Suchanfrage eigenständig die Inhalte von Videos bewerten und passende Ergebnisse ausliefern kann.

Empfehlung

Die Videoschnipsel samt Beschreibungen sind frei verfügbar und können hier eingesehen werden.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
| Featured Image: Google (Screenshot der Webseite)
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!