Inhalt
newsletter Newsletter
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
DEEP MINDS #13: KI in Deutschland & Aleph Alpha

Chinesische Forscher stellen einen Datensatz mit Röntgenbildern vor, der versteckte verbotene Gegenstände zeigt. Das soll automatisierte Sicherheitskontrollen an Flughäfen und anderen Hochsicherheitsorten ermöglichen.

Automatisierte Sicherheitskontrollen durch Bildanalyse-Systeme bieten für aktuelle KI-Methoden zahlreiche Herausforderungen: Objekte auf Röntgenbildern verdecken sich nicht vollständig, sondern sind häufig durch andere Gegenstände hindurch sichtbar. Oberflächen sind ebenfalls nicht zu erkennen. Das schließt den Einsatz von nicht für Röntgensysteme trainierten KI-Systemen aus.

Hinzu kommt: Verbotene Gegenstände werden häufig absichtlich hinter oder in anderen Gegenständen versteckt. In diesen Fällen versagen bereits existierende Systeme aufgrund mangelnder Trainingsdaten.

Wenn der Hammer eine Katze wäre, würde im zweiten Bild ihr Körper deutlich unter den anderen Objekten durchscheinen. | Bild: Wang et. al.
Wenn der Hammer eine Katze wäre, würde im zweiten Bild ihr Körper deutlich unter den anderen Objekten durchscheinen. | Bild: Wang et. al.

Chinesische Forscher veröffentlichen jetzt einen umfangreichen Datensatz mit per Hand segmentierten Röntgenbildern. PIDray enthält insgesamt 47.677 Röntgenbilder, in denen verbotene Gegenstände zu sehen sind. Vergleichbare Datensätze wie etwa SIXray enthalten zwar insgesamt mehr Bilder, aber deutlich weniger Beispiele verbotener Gegenstände.

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung

Handschellen und Powerbank

Der PIDray-Datensatz umfasst zwölf Kategorien verbotener Gegenstände, darunter Schusswaffen, Messer, Feuerzeuge, Handschellen und Powerbanks. Einige dieser Kategorien sind in verfügbaren Röntgen-Datensätzen bisher nicht enthalten.

Der Datensatz umfasst zwölf Kategorien und zahlreiche per Hand markierte Beispielbilder für das KI-Training. | Bild: Wang et. al.
Der Datensatz umfasst zwölf Kategorien und zahlreiche per Hand markierte Beispielbilder für das KI-Training. | Bild: Wang et. al.

Unter den tausenden Bildern sind neben einfach zu erkennenden Motiven auch zahlreiche Beispiele absichtlich versteckter Objekte. Diese sind auch für das menschliche Auge schwer zu finden.

Unterschiedliche Beispiele mit nach unten steigender Schwierigkeit der Erkennung. | Bild: Wang et. al.
Unterschiedliche Röntgenbildbeispiele, die nach unten zunehmend schwieriger zu erkennen sind. | Bild: Wang et. al.

Neben dem Datensatz stellen die Forscher auch SDANet vor, eine Bildanalyse-KI, die auf den aus den Transformern bekannten Aufmerksamkeitsmechanismus setzt. SDANet soll vor allem bei der Erkennung absichtlich versteckter Objekte glänzen.

Sicherheit am Flughafen: Der Mensch muss vorerst weiter prüfen

Bei einem Vergleich trainierten die Forscher zahlreiche ähnliche Systeme mit dem PIDray-Datensatz und testeten die Erkennungsfähigkeit für einfache, schwere und versteckte Fälle. In allen Fällen schneidet SDANet am besten ab, schiebt sich aber im Schnitt lediglich zwischen 1,3 und 1,5 Prozent vor das beste alternative System.

Darüber hinaus ist auch für SDANet die Erkennung versteckte Objekte immer noch ein Problem: Trotz umfassenden PIDray-Datensatz und spezialisierter KI-Architektur erreicht das System nur knapp 50 Prozent Genauigkeit.

Empfehlung

Die Forscher hoffen, dass PIDray in Zukunft als Teil eines universellen Benchmarks dienen kann, der bessere Systeme ermöglicht. Dazu soll der bestehende Datensatz in Zukunft mit mehr Bildern erweitert werden.

Weiterlesen über Künstliche Intelligenz:

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!