KI für Blinde: Google Chrome liest jetzt Bilder vor

12. Oktober 2019

Mit Künstlicher Intelligenz will Google Bilder im Internet für blinde Menschen hörbar machen. Schon mehr als zehn Millionen Bilder wurden automatisch beschriftet.

Im Internet gibt's Millionen Bilder, aber nur wenige davon sind mit beschreibendem Text hinterlegt. Den benötigen Screenreader allerdings, um den Inhalt eines Bildes in Sprachausgabe oder Braillezeile auszugeben.

Die Folge: Der Inhalt von Bildern bleibt blinden oder sehbehinderten Menschen häufig verwehrt. Im schlimmsten Fall erschließt sich dann der Inhalt einer Webseite nicht mehr.

Google möchte dieses Problem mit einer auf Objekterkennung in Bildern trainierten KI lösen: Die Funktion heißt "Get image descriptions on Chrome" und steht ab sofort in englischer Sprache für Nutzer mit Screenreader bereit. Sie kann in den erweiterten Einstellungen unter Bedienungshilfen aktiviert werden.

KI-Modelle kooperieren für die Bildanalyse

Ist die Option aktiviert, wird ein unbeschriftetes Bild an einen Google-Server geschickt. Dort wird es laut Google von mehreren KI-Modellen auf Text im Bild sowie auf Objekte untersucht. Das anspruchsvollste Modell könne das grundlegende Motiv eines Bildes in einem Satz beschreiben.

Auf diesem Bild erkannt: "Appears to be: Person playing guitar on the sofa." Bild: Google — Auf diesem Bild erkannt: "Appears to be: Person playing guitar on the sofa." Stimmt. Details wie das Geschlecht, die Farbe des Sofas oder das Notebook fehlen zwar, allerdings ist das besser als gar keine Beschreibung. Bild: Google

Die KI-Modelle evaluieren ihre Beschreibungen gegenseitig: Eine Beschreibung soll nur ausgegeben werden, wenn die Modelle einigermaßen sicher sind, dass sie passend ist. Bei Unsicherheit wird eine möglichst einfache oder gar keine Beschreibung ausgegeben.

KI für Blinde: Google Chrome liest jetzt Bilder vor — "Appears to be: Fruits and vegetables at the market." Die Bildidee wird wiedergegeben, die Details, nämlich die Früchte selbst, noch nicht. Außerdem ist kein Gemüse im Bild. Bild: Google

Die Beschreibungen seien zwar noch nicht so gut wie jene von Menschen, schreibt Google, sie könnten aber akkurat und hilfreich sein. In den letzten Monaten seien bei Tests mehr als zehn Millionen Bildbeschreibungen generiert worden. Jeden Tag würden hunderttausende hinzugefügt. Unterstützung für weitere Sprachen soll bald folgen.

Eine ähnliche KI-Software stellte Microsoft kürzlich fürs Smartphone vor: Sie erkennt Personen oder Objekte nach Berührung und liest die dazu passenden Begriffe vor. Allerdings funktionierte sie bei Veröffentlichung nur mäßig.

Quelle: Google

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

KI für Blinde: Google Chrome liest jetzt Bilder vor

KI-Modelle kooperieren für die Bildanalyse

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.