In Googles Smartphone-Browser-Spiel "Emoji Scavenger Hunt" bekommt der Spieler einen Emoji auf dem Display angezeigt. Das dazu passende reale Objekt muss er mit seiner Smartphone-Kamera in der Umgebung suchen. Wie weit ist Googles intelligente Bilderkennung fortgeschritten?
Google beschreibt das Spiel als Experiment. Da man der KI eine schwarz-weiß gestreifte Box als ein Klavier verkaufen kann, weiß man, weshalb. Die Software lässt sich aber nicht immer so einfach austricksen – eindeutige Motive erkennt die KI sogar in Bewegung.
Wie gut die Bildanalyse schon funktioniert, ist zum Beispiel für Augmented Reality interessant. Ohne schnelle und verlässliche Objekterkennung gibt's auch keine fortschrittliche digital erweiterte Realität.
Die Spielregeln: Schnitzeljagd mit Objekterkennung
Gespielt wird direkt im Smartphone-Browser. Sobald man den Play-Button drückt, wird von drei heruntergezählt. Jetzt sind 20 Sekunden Zeit, um das geforderte Objekt zu finden. Das Spiel zeigt Emojis wie einen Rucksack, einen Laptop oder den Daumen hoch an. Ab und an gibt es auch mal ausgefallenere Emojis.
Mit der Kamera scannt man sein Zuhause nach zu den Emojis passenden realen Gegenständen ab. Die Erkennung übernimmt eine Bildanalysesoftware von Google.
Hat man ein Objekt gefunden, werden die verbliebenen Sekunden aufs Zeitkonto gutgeschrieben. Die finale Punktzahl entspricht der Anzahl gefundener Objekte.
Die aufgezeichneten Bilder werden von einer Computerstimme kommentiert. Auch hier kommt es zu Aussetzern. Als ich ein Glas Wasser im Visier habe, fragt die Stimme: "Liegt da eine Sauerstoffmaske?" Fast richtig. Zumindest gibt es einen Sinnzusammenhang.
Kein kostenloses Training für Googles Bildanalyse-KI
Das Spiel ist ein netter Zeitvertreib und laut Google kein billiger Trick, um die eigene Bildanalyse-KI mit Nutzerdaten zu trainieren, wie es beispielsweise Facebook mit Instagram macht.
In den FAQs verspricht das Unternehmen, dass die Interaktionen nur lokal auf dem jeweiligen Gerät getätigt und keine Bilder auf den Google Servern gespeichert werden. Am Experiment teilnehmen kann jeder Smartphone-Besitzer direkt im Browser.
Die Browser-App basiert auf Googles Tensorflow, einer Open-Source-Programmbibliothek für Künstliche Intelligenz, die speziell für die Bildverarbeitung geeignet ist. Sie ist zum Beispiel die technische Grundlage der bekannten Deepfakes-Pornofälschungen.