Anzeige
Skip to content

Microsofts neue Bild-KI beschreibt Inhalte auf Fotos nach Berührung

Image description

Microsofts KI-gestützte App für Bilderkennung macht blinden Menschen Fotos besser verständlich. Zumindest theoretisch.

Microsofts kostenlose KI-App "Seeing AI" für iOS (iPad & iPhone) kann über die Smartphone-Kamera Objekte erkennen und vertonen. Gedacht ist sie in erster Linie als auditive Sehhilfe für blinde Menschen.

Jetzt aktualisiert Microsoft die App mit einer neuen Funktion: Tippt man auf ein Foto, beispielsweise auf einer Webseite oder in einem sozialen Netzwerk, analysiert die Bild-KI die Aufnahme und beschreibt deren Inhalt.

Sie kann einzelne Objekte im Bild voneinander getrennt beschreiben - beispielsweise Hund, Mensch, Stuhl - und sogar das Aussehen einzelner Menschen und die Emotionen in ihren Gesichtern in Worte fassen. Blinde können das Bild so nach und nach abtippen und sich den Inhalt der Aufnahme erschließen.

Anzeige
DEC_D_Incontent-1

Microsofts Bild-KI soll Menschen und Emotionen erkennen und beschreiben. Bild: Microsoft
Microsofts Bild-KI soll Menschen und Emotionen erkennen und beschreiben. Bild: Microsoft

Bilderkennung noch nicht präzise genug

In der Theorie zumindest. In der Praxis zeigt ein kurzer Test mit etwa zehn Bildern, dass die Bilderkennung noch lange nicht präzise ist und der Inhalt eines Fotos häufig nur rudimentär oder falsch beschrieben wird.

Beispielsweise wird ein Beagle-Welpe vor einer Hundehütte beschrieben als "braun-weißer Hund, der vor einem Haus steht"- das ist nicht verkehrt, aber unvollständig.

Meine Freundin wurde als Mann, als Junge oder schlicht als "Person mit Hut" erkannt. Ich wurde rund acht Jahre älter, sie circa zehn Jahre jünger eingeschätzt.

Ein belegtes Brot machte die KI zu einer Pizza - auch lecker, aber leider falsch. Gurken, Tomaten und Zwiebeln im Bild waren einfach nur "Nahrung". Da ist also noch Training angesagt, bis die Bild-KI blinden Menschen wirklich helfen kann.

Anzeige
DEC_D_Incontent-2

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren