Inhalt
newsletter Newsletter

Forscher wollen sehbeeinträchtigen Menschen mit KI-Werkzeugen den Alltag erleichtern. Eine neue Arbeit zeigt eine KI-gelenkte Drohne, die als fliegender Führhund dient.

Anzeige

Fortschritte im maschinellen Sehen ermöglichen leistungsfähige Bildanalyse-Systeme, die auf moderater Hardware laufen: Ein günstiger Raspberry Pi etwa reicht in Verbindung mit einer Kamera und einem Open Source KI-Modell für ein verlässliche Hundeerkennungssystem.

Natürlich existieren visuell komplexere Aufgabe wie die Navigation autonomer Autos. Die dort eingesetzten KI-Systeme müssen befahrbare Straßen, Bürgersteige, Verkehrsschilder, Passanten, andere Autos und Schlaglöcher erkennen.

Bei der dort eingesetzten semantischen Bild-Segmentierung müssen nicht nur einzelne Hunde vor einem Hintergrund herausgepickt werden, sondern jedes einzelne Pixel eines Bildes muss einer bestimmten Klasse zugeordnet werden. So können autonome Autos Straßen und Bürgersteige als solche identifizieren und navigierbare Wege finden.

Anzeige
Anzeige

Abseits des autonomen Fahrens gibt es ein weiteres naheliegendes Einsatzgebiet für KI-Navigation: Sehbeeinträchtigte Menschen könnten von der Technologie profitieren. Forscher:innen der TU Graz arbeiten etwa in Kooperation mit Tec-Inno an einem Kamera-bestückten Schuh, der Personen mit Sehbeinträchtigung bei der Navigation hilft.

Kamera-Drohne als fliegender Führhund

Forscher des Karlsruher Instituts für Technologie haben nun eine fliegen Drohne mit semantischer Bild-Segmentierung kombiniert für einen "fliegenden Führhund": Die KI-Drohne soll sehbeeinträchtigen Menschen helfen, sich sicher durch Städte zu bewegen.

Dafür hält der Mensch die Drohne wie einen Hund an der Leine: Die Drohne scannt mit ihrer Kamera die Umgebung, erkennt begehbare Wege, Hindernisse und Ampeln und führt den Menschen auf die geplanten Routen. Über ein Knochenleitungs-Headset gibt es auditiv zusätzliche Informationen, etwa über den Status einer Ampel.

Per semantischer Bild-Segmentierung erkennt das System begehbare Straßen, ein zweites System klassifiziert die Ampeln und erkennt ihren Zustand. Die Drohnenkontrolle übernimmt diese Informationen, um die Route zu planen. Per Headset erhält der geführte Mensch zusätzliche Audioanweisungen. | Bild: Tan et al.
Per semantischer Bild-Segmentierung erkennt das System begehbare Straßen, ein zweites System klassifiziert die Ampeln und erkennt ihren Zustand. Die Drohnenkontrolle übernimmt diese Informationen, um die Route zu planen. Per Headset erhält der geführte Mensch zusätzliche Audioanweisungen. | Bild: Tan et al.

Die Algorithmen laufen auf einem Notebook, das die Drohnen-geführte Person im Rucksack mit sich trägt. Für ihre Forschung nutzten die Autoren ein System mit Intel i7 CPU und einer Nvidia GeForce GTX 1050 Ti GPU. Mit dieser Rechenleistung konnten elf Bilder pro Sekunde ausgewertet werden, die von der 720p-Kamera einer DJI Tello-Drohne kommen.

Größere Drohne, mehr Strom und KI-Computer

In Tests hätten Personen die Drohne hilfreich gefunden und konnten diese relativ einfach nutzen, schreiben die Autoren. Verbesserungsbedarf gebe es bei der Erkennung der Ampeln.

Empfehlung

Die Drohne sei außerdem zu leicht und halte daher Windböen nicht stand. Eine größere Drohne, die zusätzlich mehr Akku-Laufzeit hat, soll daher als Nächstes getestet werden. Das Notebook soll außerdem durch einen integrierten KI-Beschleuniger wie Nvidias Jetson AGX Xavier oder Jetson Nano ersetzt werden.

Gegen einen Führhund ist die Drohnenlösung bisher nicht angetreten. Wenn die Entwicklung anderer KI-Sehsysteme für die echte Welt der Maßstab sind, wird das wohl auch noch eine Weile dauern.

Doch in Zukunft könnten KI-Drohnen und Kameraschuhe einen ausgebildeter Führhund mit all seinen Hunde-Qualitäten zum Luxusprodukt machen. Kuscheln können sie allerdings nicht.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Weiterlesen über Künstliche Intelligenz:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!