Inhalt
newsletter Newsletter

Wenn es nach Google geht, dann ist die Kamera längst mehr als eine Fotomaschine. In Kombination mit KI soll sie die Grundlage für eine neue Computerära legen.

Anzeige

Laut Googles-Managerin Aparna Chennaprapagada, verantwortlich für Lens und Augmented Reality, sind bis zu 15 Prozent der Smartphone-Fotos Alltags- und Erinnerungshilfen: Zum Beispiel wird die Einkaufsliste fotografiert oder ein Produkt im Schaufenster.

Googles Bildanalyse-KI soll dieser Entwicklung Rechnung tragen: Die kürzlich überarbeitete App für iOS und Android schlägt die Brücke zwischen fotografierten Objekten, Googles enormer Bilddatenbank im Netz und der vielen Milliarden Suchanfragen.

Die KI erkennt ein Objekt in einem Foto und verknüpft es mit einer passenden Suchanfrage. Als Resultat erhält man Informationen direkt zum Motiv oder zu vergleichbaren Objekten. Lens kann Bilder sowohl in Echtzeit als auch nachträglich analysieren. Das funktioniert in der Praxis meist schnell und zuverlässig.

Anzeige
Anzeige

Zu Aussetzern neigt die Bildanalyse, wenn ein Motiv in Bewegung, bei schwierigen Lichtbedingungen – zum Beispiel mit vielen Schatten – oder aus ungewöhnlichem Winkel fotografiert wird. Zukünftig will Google den Algorithmus daher intensiver mit typischen Smartphone-Aufnahmen trainieren.

Objekterkennung als technische Grundlage für Augmented Reality

Die auf Googles Open Source KI-Framework Tensorflow gebaute App erkennt laut Google über eine Milliarde Objekte. Zum Marktstart vor einem Jahr waren es noch rund 250 Millionen. Die Erkennungsrate konnte unter anderem durch eine verbesserte Textanalyse gesteigert werden: Die App liest Beschriftungen an Produkten und lernt so neue Zusammenhänge.

Texte können außerdem direkt aus der App heraus digital gespeichert und editiert werden. Auch Live-Übersetzungen sind denkbar zum Beispiel von Straßenschildern.

Für Chennaprapagada steht fest, dass die Kamera in Kombination mit Künstlicher Intelligenz eine neue Computerära starten wird: Maschinelles Lernen, schnellere Hardware und eine große Nutzerbasis, die reichlich Fotos schießt, sollen kombiniert eine fortschrittliche Augmented Reality mit Objekterkennung und Wegweisung ermöglichen. Was Google und Chennaprapagada dazu noch fehlt, ist das passende virtuelle Interface.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Weiterlesen über Google-KI:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!