Inhalt
summary Zusammenfassung
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
KI bei der Bundeswehr und der BWI | DEEP MINDS #16

Gefahr oder Chance? Die Möglichkeit, den Standort eines Fotos zu bestimmen, birgt ein enormes Potenzial in beide Richtungen. Die Bildgeolokalisierungssysteme PIGEON und PIGEOTTO sind genauer als alle bisherigen Technologien – und der Mensch.

Eine Gruppe von Stanford-Studierenden hat mit ihren KI-Modellen PIGEON und PIGEOTTO gezeigt, dass KI in der Lage ist, genau zu bestimmen, wo ein Foto aufgenommen wurde. Diese Fähigkeit eröffnet neue Möglichkeiten, gibt jedoch auch Anlass zur Sorge, dass sie etwa für Überwachungszwecke oder Stalking missbraucht werden könnte.

Beispiel-Screenshots von PIGEON im Spiel GeoGuessr. Die KI bestimmt den Ort auf elf Kilometer genau, ein menschlicher Gegenspieler nur auf 788 Kilometer. Bild: Haas et al.

PIGEON gewinnt gegen GeoGuessr-Legende

PIGEON ist mit mehr als 500.000 Bildern aus Google Street View trainiert. Das System benötigt ein Panorama aus vier Bildern als Eingabe und konnte in Testläufen das richtige Land zu 92 Prozent korrekt bestimmen. In mehr als 40 Prozent der Fälle gab es den Ort auf etwa 25 Meilen (ca. 40 km) genau an.

Bild: Haas et al.

PIGEON ist vom Online-Phänomen GeoGuessr inspiriert, bei dem Spieler:innen zufällige Google Street-View-Umgebungen angezeigt werden und sie diese anschließend auf einer Karte möglichst genau orten müssen.

Anzeige
Anzeige

In sechs aufeinanderfolgenden Matches gewann PIGEON durchweg gegen die Community-Legende Rainbolt, der als einer der besten GeoGuessr-Spieler der Welt gilt. In der GeoGuessr-Gesamtwertung liegt PIGEON unter den besten 0,01 Prozent.

PIGEOTTO setzt neue Maßstäbe

Die Fortschritte von PIGEON haben die Entwickler zu einem weiteren Modell inspiriert. Ein zweites Modell namens PIGEOTTO wurde mit vier Millionen Bildern aus Flickr und Wikipedia trainiert und benötigt statt eines Street-View-Panoramas nur ein Bild als Grundlage, was es zu einem noch leistungsfähigeren Werkzeug für die Lokalisierung von Orten auf Bildern macht.

In Benchmarks kann es daher mit bestehenden Systemen dieser Art verglichen werden. Hier schnitt PIGEOTTO als Klassenbester ab und reduzierte die Medianabweichung um den Faktor zwei bis fünf.

Beispielbilder aus dem MediaEval-Datensatz von 2016, mit dessen Hilfe PIGEOTTO trainiert wurde. | Bild: Haas et al.

Die Forschenden machen deutlich, dass es ihnen um potenziell nützliche Anwendungen geht und nicht darum, Ängste vor möglichem Missbrauch der Technologie zu schüren. Privatanwender:innen könnte sie etwa dabei helfen, Orte auf alten Fotos zu lokalisieren. Im wissenschaftlichen Bereich könnten Gegenden lokalisiert werden, in denen invasive Pflanzen- oder Tierarten wachsen.

Mit PIGEON und PIGEOTTO möchten die Wissenschaftler:innen wichtige Diskussionen auf diesem Gebiet anstoßen. „Unseres Wissens ist dies die erste moderne Bildgeolokalisierung in den letzten fünf Jahren, die nicht durch militärische Aufträge finanziert wurde“, fassen sie zusammen.

Empfehlung

Da solche Technologien jedoch sowohl für gute als auch für schlechte Zwecke eingesetzt werden können, haben sie beschlossen, die Modellgewichte nicht zu veröffentlichen.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Die von Stanford-Studierenden entwickelten KI-Modelle PIGEON und PIGEOTTO können genau vorhersagen, wo ein Foto aufgenommen wurde, was sowohl nützliche als auch potenziell missbräuchliche Anwendungen haben kann.
  • PIGEON wurde mit mehr als 500.000 Google Street View-Bildern trainiert und kann in 92 Prozent der Fälle das richtige Land erraten, während PIGEOTTO, das mit vier Millionen Flickr- und Wikipedia-Bildern trainiert wurde, nur ein einziges Bild als Eingabe benötigt.
  • Die Forschenden betonen, dass sie wichtige Diskussionen über die Anwendung solcher Technologien anregen wollen. Die Modellgewichte veröffentlichen sie nicht, um einen möglichen Missbrauch einzuschränken.
Quellen
Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!