Eine Braut ist nicht wie die andere.
Große Bilddatenbanken wie ImageNet, Open Images und Conceptual Captions tragen zusammen mit der wachsenden Rechenleistung von Computern wesentlich dazu bei, dass Künstliche Intelligenz immer mächtiger wird.
Das Problem: Die Bilder in den bekanntesten Datensätzen sind auf die USA und den Westen zentriert. Algorithmen, die mit diesen Bildern trainiert werden, versagen mitunter, wenn sie Inhalte auf Bildern anderer Kulturkreise identifizieren sollen.
Google Brain verdeutlicht das anhand einer Aufnahme einer Braut: Im Westen trägt sie typisch ein weißes Kleid, in Indien hingegen einen Sari.
Ein mit dem Open-Image-Datensatz trainierter Bildanalyse-Algorithmus erkennt in diesem Szenario nur die westliche Braut als eben solche.
Bessere Algorithmen statt mehr Bilder
Nun sollte die Lösung für dieses Problem gerade einem riesigen Datenkonzern wie Google doch leichtfallen, sollte man meinen: Alles, was es braucht, ist ein repräsentativer Datensatz mit Bildern aus aller Welt zu allen erdenklichen Menschen, Objekten und Szenarien. Google könnte einfach sämtliche Bilddatenbanken aufkaufen oder Fotos erstellen und beschriften lassen.
Der Gedanke ist nicht falsch: Google baut an so einem Datensatz.
Aber der Konzern weiß auch: Egal, wie groß der Datensatz sein wird, er wird immer Unwuchten enthalten. Hinzu kommt, dass sich Kultur verändert. Ein möglichst repräsentativer Datensatz würde also nur die Symptome behandeln, statt die Ursachen zu beseitigen.
Viel mächtiger wären Algorithmen, die den Unterschied zwischen den Kulturen kennen und erkennen, die also wie Menschen generalisiert beurteilen, anstatt nur jeden einzelnen Pixel auf jedem einzelnen Bild zu analysieren.
Ein globaler Wettbewerb soll Fortschritte bringen
Aus diesem Grund rief Google im September den "Inclusive Images Competition" aus. Die Aufgabe der Wettbewerber: Das Vorurteil in Algorithmen reduzieren, die mit kulturell einseitigen Datensätzen trainiert wurden.
Über 100 Teilnehmer testeten ihre Algorithmen bei Googles KI-Benchmark-Plattform Kaggle an von Google vorgegebenen Bilddatenbanken mit Fotos aus sonst unterrepräsentierten Kulturkreisen.
Auf einer Fachkonferenz (via Venturebeat) bewertete Google-Brain-Forscher Pallavi Baljekar jetzt erstmals die bisherigen Resultate. Er spricht von kleinen Schritten hin zu vorurteilsfreien KI-Systemen: Die besten fünf Algorithmen erkannten die indische Braut als Person. Von einem Algorithmus wurde sie korrekt als Braut klassifiziert.