Damit eine Künstliche Intelligenz menschliche Aufgaben erfüllen kann, muss sie die Welt wie ein Mensch wahrnehmen und einordnen können. Um dieses Ziel zu erreichen, gibt Facebook KI-Agenten Sinne, ein räumliches Gedächtnis und virtuelle Umgebungen, in denen sie sich menschliche Fähigkeiten antrainieren können. Die Forschung soll am Ende auch AR-Brillen zugutekommen und Trägern "Superkräfte" verleihen.
Im März 2019 stellt Facebook die Simulationsplattform Habitat vor, ein VR-Zuhause für KI-Agenten, in dem sie durch komplexe Umgebungen navigieren und mit Objekten interagieren lernen.
Der Vorteil der VR-Simulation ist, dass sie ohne Unfallgefahr und stark beschleunigt vonstatten geht: Mit rund 10.000 Bildern pro Sekunde soll sie auf einer einzelnen Grafikkarte laufen. Als Datengrundlage dienen photorealistische 3D-Rekonstruktionen von Innenräumen.
Der Forschungsansatz ist insofern neu, da die KI nicht mehr nur mit statischen Datensätzen gefüttert wird. Sie soll sich stattdessen im Austausch mit der Welt und mit Hilfe versinnlichter Erfahrungen wie ein Mensch Weltwissen aneignen, kontextualisieren und selbstständige Lösungen auf komplexe Probleme finden lernen. In Forschungsarbeiten stellt Facebook drei neue KI-Fähigkeiten und -Lernplattformen vor, die diesem Ziel entgegenarbeiten.
KI lernt hören und navigieren
Die erste Fähigkeit verleiht KI-Agenten einen Hörsinn, sodass sie sich anhand von Geräuschquellen in ihrer Umwelt orientieren können. Dank akustischem Training sollen KI-Agenten eines Tages beispielsweise in der Lage sein, verschiedene Geräusche zu unterscheiden, auf einen Alarm zu reagieren und selbstständig durch Räume zur Quelle zu navigieren.
Die zweite Fähigkeit ahmt die Art und Weise nach, wie Menschen sich Anordnungen von Räumen merken. Hierbei erkundet eine KI zunächst eine Reihe von Räumlichkeiten, beobachtet und merkt sich deren Eigenschaften.
Danach erstellt sie aus dieser räumlichen Information einen 2D-Grundriss, mit Hilfe dessen sie voraussagen kann, wo sich bestimmte Objekte wie zum Beispiel ein Küchenabfluss befinden.
Menschen treffen auf Basis realweltlicher Erfahrungen Voraussagen über die Beschaffenheit von Räumen. Sie wissen beispielsweise, dass um einen Küchentisch genug Raum sein muss für Stühle.
Mit der dritten Fähigkeit lernen KIs, solche Voraussagen zu treffen, auch wenn ihre Sicht auf einen Wohnbereich teilweise oder ganz verdeckt ist. Bislang müssen KIs einen Raum vollständig scannen, um akkurate Aussagen über dessen Beschaffenheit zu treffen.
Superhirn dank KI-Technik?
Geht es nach Facebooks Technikchef Mike Schroepfer, soll diese KI-Technologie eines Tages AR-Brillen unterstützen. Der integrierte KI-Assistent könnte dank entsprechender Sensoren entfernte Geräuschquellen ausmachen und Brillenträger den Weg zu ihnen zeigen oder sich merken, wo man die Geldbörse oder den Schlüssel hingelegt hat. Die AR-Brille als KI-gestützte Gedächtnishilfe?
"Letztendlich hoffen wir, dass diese AR-Brille den Menschen Superkräfte verleiht", sagt Schroepfer gegenüber CNN Business.
Die technischen Herausforderungen für die Herstellung einer solchen Techbrille sind indes enorm. Sensoren, Handtracking und Displaytechnik fressen viel Rechenleistung, was in Abwärme und hohem Energiebedarf resultiert. Das wiederum beißt sich mit dem Ziel, AR-Brillen zu entwickeln, die leicht und bequem zu tragen sind und modisch aussehen.
Künstliche Intelligenz (News) ist in diesem Kontext gleich in zweifachem Sinne eine Grundlagentechnologie für AR-Brillen: Zum einen ermöglicht sie erst effiziente Objekt- und Handerkennung, zum anderen optimiert sie diese Prozesse dank hochspezialisierter neuronaler Netze, sodass die Brillen weniger Energie verbrauchen.
Facebooks KI-Chefforscher Yann LeCun sieht AR-Brillen als Endboss für KI: Bei Leistung und Stromverbrauch, und damit Wärmeentwicklung, seien für wirklich schmale AR-Brillen Fortschritte notwendig, die über den aktuellen Stand von Technologie hinausgingen - neuronale Netze seien in diesem Kontext ein möglicher "Trick".
Quelle: Facebook AI, CNN Business, Titelbild: Facebooks Konzept eines zukünftigen Mixed-Reality-Visors