Chinesische Forscher stellen einen Datensatz mit Röntgenbildern vor, der versteckte verbotene Gegenstände zeigt. Das soll automatisierte Sicherheitskontrollen an Flughäfen und anderen Hochsicherheitsorten ermöglichen.
Automatisierte Sicherheitskontrollen durch Bildanalyse-Systeme bieten für aktuelle KI-Methoden zahlreiche Herausforderungen: Objekte auf Röntgenbildern verdecken sich nicht vollständig, sondern sind häufig durch andere Gegenstände hindurch sichtbar. Oberflächen sind ebenfalls nicht zu erkennen. Das schließt den Einsatz von nicht für Röntgensysteme trainierten KI-Systemen aus.
Hinzu kommt: Verbotene Gegenstände werden häufig absichtlich hinter oder in anderen Gegenständen versteckt. In diesen Fällen versagen bereits existierende Systeme aufgrund mangelnder Trainingsdaten.
Chinesische Forscher veröffentlichen jetzt einen umfangreichen Datensatz mit per Hand segmentierten Röntgenbildern. PIDray enthält insgesamt 47.677 Röntgenbilder, in denen verbotene Gegenstände zu sehen sind. Vergleichbare Datensätze wie etwa SIXray enthalten zwar insgesamt mehr Bilder, aber deutlich weniger Beispiele verbotener Gegenstände.
Handschellen und Powerbank
Der PIDray-Datensatz umfasst zwölf Kategorien verbotener Gegenstände, darunter Schusswaffen, Messer, Feuerzeuge, Handschellen und Powerbanks. Einige dieser Kategorien sind in verfügbaren Röntgen-Datensätzen bisher nicht enthalten.
Unter den tausenden Bildern sind neben einfach zu erkennenden Motiven auch zahlreiche Beispiele absichtlich versteckter Objekte. Diese sind auch für das menschliche Auge schwer zu finden.
Neben dem Datensatz stellen die Forscher auch SDANet vor, eine Bildanalyse-KI, die auf den aus den Transformern bekannten Aufmerksamkeitsmechanismus setzt. SDANet soll vor allem bei der Erkennung absichtlich versteckter Objekte glänzen.
Sicherheit am Flughafen: Der Mensch muss vorerst weiter prüfen
Bei einem Vergleich trainierten die Forscher zahlreiche ähnliche Systeme mit dem PIDray-Datensatz und testeten die Erkennungsfähigkeit für einfache, schwere und versteckte Fälle. In allen Fällen schneidet SDANet am besten ab, schiebt sich aber im Schnitt lediglich zwischen 1,3 und 1,5 Prozent vor das beste alternative System.
Darüber hinaus ist auch für SDANet die Erkennung versteckte Objekte immer noch ein Problem: Trotz umfassenden PIDray-Datensatz und spezialisierter KI-Architektur erreicht das System nur knapp 50 Prozent Genauigkeit.
Die Forscher hoffen, dass PIDray in Zukunft als Teil eines universellen Benchmarks dienen kann, der bessere Systeme ermöglicht. Dazu soll der bestehende Datensatz in Zukunft mit mehr Bildern erweitert werden.