Diese KI weiß, wo du welches Foto aufgenommen hast

DALL-E 3 prompted by THE DECODER

Gefahr oder Chance? Die Möglichkeit, den Standort eines Fotos zu bestimmen, birgt ein enormes Potenzial in beide Richtungen. Die Bildgeolokalisierungssysteme PIGEON und PIGEOTTO sind genauer als alle bisherigen Technologien – und der Mensch.

Eine Gruppe von Stanford-Studierenden hat mit ihren KI-Modellen PIGEON und PIGEOTTO gezeigt, dass KI in der Lage ist, genau zu bestimmen, wo ein Foto aufgenommen wurde. Diese Fähigkeit eröffnet neue Möglichkeiten, gibt jedoch auch Anlass zur Sorge, dass sie etwa für Überwachungszwecke oder Stalking missbraucht werden könnte.

Beispiel-Screenshots von PIGEON im Spiel GeoGuessr. Die KI bestimmt den Ort auf elf Kilometer genau, ein menschlicher Gegenspieler nur auf 788 Kilometer. Bild: Haas et al.

PIGEON gewinnt gegen GeoGuessr-Legende

PIGEON ist mit mehr als 500.000 Bildern aus Google Street View trainiert. Das System benötigt ein Panorama aus vier Bildern als Eingabe und konnte in Testläufen das richtige Land zu 92 Prozent korrekt bestimmen. In mehr als 40 Prozent der Fälle gab es den Ort auf etwa 25 Meilen (ca. 40 km) genau an.

PIGEON ist vom Online-Phänomen GeoGuessr inspiriert, bei dem Spieler:innen zufällige Google Street-View-Umgebungen angezeigt werden und sie diese anschließend auf einer Karte möglichst genau orten müssen.

In sechs aufeinanderfolgenden Matches gewann PIGEON durchweg gegen die Community-Legende Rainbolt, der als einer der besten GeoGuessr-Spieler der Welt gilt. In der GeoGuessr-Gesamtwertung liegt PIGEON unter den besten 0,01 Prozent.

PIGEOTTO setzt neue Maßstäbe

Die Fortschritte von PIGEON haben die Entwickler zu einem weiteren Modell inspiriert. Ein zweites Modell namens PIGEOTTO wurde mit vier Millionen Bildern aus Flickr und Wikipedia trainiert und benötigt statt eines Street-View-Panoramas nur ein Bild als Grundlage, was es zu einem noch leistungsfähigeren Werkzeug für die Lokalisierung von Orten auf Bildern macht.

In Benchmarks kann es daher mit bestehenden Systemen dieser Art verglichen werden. Hier schnitt PIGEOTTO als Klassenbester ab und reduzierte die Medianabweichung um den Faktor zwei bis fünf.

Beispielbilder aus dem MediaEval-Datensatz von 2016, mit dessen Hilfe PIGEOTTO trainiert wurde. | Bild: Haas et al.

Die Forschenden machen deutlich, dass es ihnen um potenziell nützliche Anwendungen geht und nicht darum, Ängste vor möglichem Missbrauch der Technologie zu schüren. Privatanwender:innen könnte sie etwa dabei helfen, Orte auf alten Fotos zu lokalisieren. Im wissenschaftlichen Bereich könnten Gegenden lokalisiert werden, in denen invasive Pflanzen- oder Tierarten wachsen.

Mit PIGEON und PIGEOTTO möchten die Wissenschaftler:innen wichtige Diskussionen auf diesem Gebiet anstoßen. „Unseres Wissens ist dies die erste moderne Bildgeolokalisierung in den letzten fünf Jahren, die nicht durch militärische Aufträge finanziert wurde“, fassen sie zusammen.

Empfehlung

KI-Forschung

Nvidias Blackwell trainiert GPT-4 in 10 Tagen - aber löst das die Probleme aktueller Modelle?

Da solche Technologien jedoch sowohl für gute als auch für schlechte Zwecke eingesetzt werden können, haben sie beschlossen, die Modellgewichte nicht zu veröffentlichen.