Mit Künstlicher Intelligenz will Google Bilder im Internet für blinde Menschen hörbar machen. Schon mehr als zehn Millionen Bilder wurden automatisch beschriftet.
Im Internet gibt's Millionen Bilder, aber nur wenige davon sind mit beschreibendem Text hinterlegt. Den benötigen Screenreader allerdings, um den Inhalt eines Bildes in Sprachausgabe oder Braillezeile auszugeben.
Die Folge: Der Inhalt von Bildern bleibt blinden oder sehbehinderten Menschen häufig verwehrt. Im schlimmsten Fall erschließt sich dann der Inhalt einer Webseite nicht mehr.
Google möchte dieses Problem mit einer auf Objekterkennung in Bildern trainierten KI lösen: Die Funktion heißt "Get image descriptions on Chrome" und steht ab sofort in englischer Sprache für Nutzer mit Screenreader bereit. Sie kann in den erweiterten Einstellungen unter Bedienungshilfen aktiviert werden.
KI-Modelle kooperieren für die Bildanalyse
Ist die Option aktiviert, wird ein unbeschriftetes Bild an einen Google-Server geschickt. Dort wird es laut Google von mehreren KI-Modellen auf Text im Bild sowie auf Objekte untersucht. Das anspruchsvollste Modell könne das grundlegende Motiv eines Bildes in einem Satz beschreiben.
Die KI-Modelle evaluieren ihre Beschreibungen gegenseitig: Eine Beschreibung soll nur ausgegeben werden, wenn die Modelle einigermaßen sicher sind, dass sie passend ist. Bei Unsicherheit wird eine möglichst einfache oder gar keine Beschreibung ausgegeben.
Die Beschreibungen seien zwar noch nicht so gut wie jene von Menschen, schreibt Google, sie könnten aber akkurat und hilfreich sein. In den letzten Monaten seien bei Tests mehr als zehn Millionen Bildbeschreibungen generiert worden. Jeden Tag würden hunderttausende hinzugefügt. Unterstützung für weitere Sprachen soll bald folgen.
Eine ähnliche KI-Software stellte Microsoft kürzlich fürs Smartphone vor: Sie erkennt Personen oder Objekte nach Berührung und liest die dazu passenden Begriffe vor. Allerdings funktionierte sie bei Veröffentlichung nur mäßig.
Quelle: Google