Inhalt
newsletter Newsletter

Eine Braut ist nicht wie die andere.

Anzeige

Große Bilddatenbanken wie ImageNet, Open Images und Conceptual Captions tragen zusammen mit der wachsenden Rechenleistung von Computern wesentlich dazu bei, dass Künstliche Intelligenz immer mächtiger wird.

Das Problem: Die Bilder in den bekanntesten Datensätzen sind auf die USA und den Westen zentriert. Algorithmen, die mit diesen Bildern trainiert werden, versagen mitunter, wenn sie Inhalte auf Bildern anderer Kulturkreise identifizieren sollen.

Google Brain verdeutlicht das anhand einer Aufnahme einer Braut: Im Westen trägt sie typisch ein weißes Kleid, in Indien hingegen einen Sari.

Anzeige
Anzeige

Ein mit dem Open-Image-Datensatz trainierter Bildanalyse-Algorithmus erkennt in diesem Szenario nur die westliche Braut als eben solche.

Vier Bräute, nur drei werden erkannt. Bild: Google
Vier Bräute, nur drei werden erkannt. Bild: Google

Bessere Algorithmen statt mehr Bilder

Nun sollte die Lösung für dieses Problem gerade einem riesigen Datenkonzern wie Google doch leichtfallen, sollte man meinen: Alles, was es braucht, ist ein repräsentativer Datensatz mit Bildern aus aller Welt zu allen erdenklichen Menschen, Objekten und Szenarien. Google könnte einfach sämtliche Bilddatenbanken aufkaufen oder Fotos erstellen und beschriften lassen.

Der Gedanke ist nicht falsch: Google baut an so einem Datensatz.

Aber der Konzern weiß auch: Egal, wie groß der Datensatz sein wird, er wird immer Unwuchten enthalten. Hinzu kommt, dass sich Kultur verändert. Ein möglichst repräsentativer Datensatz würde also nur die Symptome behandeln, statt die Ursachen zu beseitigen.

Viel mächtiger wären Algorithmen, die den Unterschied zwischen den Kulturen kennen und erkennen, die also wie Menschen generalisiert beurteilen, anstatt nur jeden einzelnen Pixel auf jedem einzelnen Bild zu analysieren.

Empfehlung

Ein globaler Wettbewerb soll Fortschritte bringen

Aus diesem Grund rief Google im September den "Inclusive Images Competition" aus. Die Aufgabe der Wettbewerber: Das Vorurteil in Algorithmen reduzieren, die mit kulturell einseitigen Datensätzen trainiert wurden.

Über 100 Teilnehmer testeten ihre Algorithmen bei Googles KI-Benchmark-Plattform Kaggle an von Google vorgegebenen Bilddatenbanken mit Fotos aus sonst unterrepräsentierten Kulturkreisen.

Die Bildverteilung im Open-Image-Datensatz im Vergleich zu den Datensätzen des Wettbewerbs. Bild: Google
Die Bildverteilung im Open-Image-Datensatz im Vergleich zu den Datensätzen des Wettbewerbs. Bild: Google

Auf einer Fachkonferenz (via Venturebeat) bewertete Google-Brain-Forscher Pallavi Baljekar jetzt erstmals die bisherigen Resultate. Er spricht von kleinen Schritten hin zu vorurteilsfreien KI-Systemen: Die besten fünf Algorithmen erkannten die indische Braut als Person. Von einem Algorithmus wurde sie korrekt als Braut klassifiziert.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Weiterlesen über KI-Vorurteile:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!