Künstliche Intelligenz

Microsofts neue Bild-KI beschreibt Inhalte auf Fotos nach Berührung

Matthias Bastian
Eine KI-gestützte App für Bilderkennung macht Blinden Fotos besser verständlich. Zumindest theoretisch.

Microsofts KI-gestützte App für Bilderkennung macht blinden Menschen Fotos besser verständlich. Zumindest theoretisch.

Microsofts kostenlose KI-App "Seeing AI" für iOS (iPad & iPhone) kann über die Smartphone-Kamera Objekte erkennen und vertonen. Gedacht ist sie in erster Linie als auditive Sehhilfe für blinde Menschen.

Jetzt aktualisiert Microsoft die App mit einer neuen Funktion: Tippt man auf ein Foto, beispielsweise auf einer Webseite oder in einem sozialen Netzwerk, analysiert die Bild-KI die Aufnahme und beschreibt deren Inhalt.

Sie kann einzelne Objekte im Bild voneinander getrennt beschreiben - beispielsweise Hund, Mensch, Stuhl - und sogar das Aussehen einzelner Menschen und die Emotionen in ihren Gesichtern in Worte fassen. Blinde können das Bild so nach und nach abtippen und sich den Inhalt der Aufnahme erschließen.

Microsofts Bild-KI soll Menschen und Emotionen erkennen und beschreiben. Bild: Microsoft

Bilderkennung noch nicht präzise genug

In der Theorie zumindest. In der Praxis zeigt ein kurzer Test mit etwa zehn Bildern, dass die Bilderkennung noch lange nicht präzise ist und der Inhalt eines Fotos häufig nur rudimentär oder falsch beschrieben wird.

Beispielsweise wird ein Beagle-Welpe vor einer Hundehütte beschrieben als "braun-weißer Hund, der vor einem Haus steht"- das ist nicht verkehrt, aber unvollständig.

Meine Freundin wurde als Mann, als Junge oder schlicht als "Person mit Hut" erkannt. Ich wurde rund acht Jahre älter, sie circa zehn Jahre jünger eingeschätzt.

Ein belegtes Brot machte die KI zu einer Pizza - auch lecker, aber leider falsch. Gurken, Tomaten und Zwiebeln im Bild waren einfach nur "Nahrung". Da ist also noch Training angesagt, bis die Bild-KI blinden Menschen wirklich helfen kann.

Weiterlesen über Mixed-Reality-Hilfen für Sehbehinderte: