Forscher wollen sehbeeinträchtigen Menschen mit KI-Werkzeugen den Alltag erleichtern. Eine neue Arbeit zeigt eine KI-gelenkte Drohne, die als fliegender Führhund dient.
Fortschritte im maschinellen Sehen ermöglichen leistungsfähige Bildanalyse-Systeme, die auf moderater Hardware laufen: Ein günstiger Raspberry Pi etwa reicht in Verbindung mit einer Kamera und einem Open Source KI-Modell für ein verlässliche Hundeerkennungssystem.
Natürlich existieren visuell komplexere Aufgabe wie die Navigation autonomer Autos. Die dort eingesetzten KI-Systeme müssen befahrbare Straßen, Bürgersteige, Verkehrsschilder, Passanten, andere Autos und Schlaglöcher erkennen.
Bei der dort eingesetzten semantischen Bild-Segmentierung müssen nicht nur einzelne Hunde vor einem Hintergrund herausgepickt werden, sondern jedes einzelne Pixel eines Bildes muss einer bestimmten Klasse zugeordnet werden. So können autonome Autos Straßen und Bürgersteige als solche identifizieren und navigierbare Wege finden.
Abseits des autonomen Fahrens gibt es ein weiteres naheliegendes Einsatzgebiet für KI-Navigation: Sehbeeinträchtigte Menschen könnten von der Technologie profitieren. Forscher:innen der TU Graz arbeiten etwa in Kooperation mit Tec-Inno an einem Kamera-bestückten Schuh, der Personen mit Sehbeinträchtigung bei der Navigation hilft.
Kamera-Drohne als fliegender Führhund
Forscher des Karlsruher Instituts für Technologie haben nun eine fliegen Drohne mit semantischer Bild-Segmentierung kombiniert für einen "fliegenden Führhund": Die KI-Drohne soll sehbeeinträchtigen Menschen helfen, sich sicher durch Städte zu bewegen.
Dafür hält der Mensch die Drohne wie einen Hund an der Leine: Die Drohne scannt mit ihrer Kamera die Umgebung, erkennt begehbare Wege, Hindernisse und Ampeln und führt den Menschen auf die geplanten Routen. Über ein Knochenleitungs-Headset gibt es auditiv zusätzliche Informationen, etwa über den Status einer Ampel.
Die Algorithmen laufen auf einem Notebook, das die Drohnen-geführte Person im Rucksack mit sich trägt. Für ihre Forschung nutzten die Autoren ein System mit Intel i7 CPU und einer Nvidia GeForce GTX 1050 Ti GPU. Mit dieser Rechenleistung konnten elf Bilder pro Sekunde ausgewertet werden, die von der 720p-Kamera einer DJI Tello-Drohne kommen.
Größere Drohne, mehr Strom und KI-Computer
In Tests hätten Personen die Drohne hilfreich gefunden und konnten diese relativ einfach nutzen, schreiben die Autoren. Verbesserungsbedarf gebe es bei der Erkennung der Ampeln.
Die Drohne sei außerdem zu leicht und halte daher Windböen nicht stand. Eine größere Drohne, die zusätzlich mehr Akku-Laufzeit hat, soll daher als Nächstes getestet werden. Das Notebook soll außerdem durch einen integrierten KI-Beschleuniger wie Nvidias Jetson AGX Xavier oder Jetson Nano ersetzt werden.
Gegen einen Führhund ist die Drohnenlösung bisher nicht angetreten. Wenn die Entwicklung anderer KI-Sehsysteme für die echte Welt der Maßstab sind, wird das wohl auch noch eine Weile dauern.
Doch in Zukunft könnten KI-Drohnen und Kameraschuhe einen ausgebildeter Führhund mit all seinen Hunde-Qualitäten zum Luxusprodukt machen. Kuscheln können sie allerdings nicht.