Mit Googles Tensorflow 3D soll Künstliche Intelligenz die Umwelt besser verstehen lernen. Das neue KI-Framework ist speziell für die Verarbeitung der Daten von 3D-Sensoren vorgesehen.
Computer Vision ist Gegenwarts- und Zukunftstechnologie: Sehende Computer, die sich in einer Umgebung orientieren und durch sie navigieren können, ermöglichen beispielsweise Trackingverfahren für XR-Brillen, lassen autonome Autos die Spur halten und Roboterstaubsauger das Haustier verschonen.
Dieses 3D-Verständnis für die Umgebung will Google jetzt besser in die eigene Open-Source-KI-Plattform Tensorflow integrieren: Tensorflow 3D soll das 3D-Szenenverständnis weiter verbessern und die Einstiegshürden für interessierte Forscher senken.
Laut Google handelt es sich bei Tensorflow 3D um eine "hochgradig modulare und effiziente Bibliothek" speziell für das Deep Learning und die Daten von 3D-Sensoren wie dem Lidar-System, das im neuen iPhone Pro 12 steckt und bessere Augmented Reality ermöglicht.
Tensorflow 3D: Open Source KI-Grundlage für AR, Roboter und autonome Autos
Tensorflow 3D bietet Trainings- und Evaluierungspipelines für 3D-Segmentierung, -Objekterkennung und -Instanzsegmentierung mit Unterstützung für verteiltes Training. Das 3D-Szenenverständnis ist außerdem Grundlage für die 3D-Objektformvorhersage, Punktwolkenregistrierung und -verdichtung.
Die 3D-Segmentierung erlaubt es einer KI beispielsweise, zwischen Vorder- und Hintergrund und einzelnen Objekten zu unterscheiden. Darüber hinaus bietet Tensorflow 3D eine einheitliche Datensatzspezifikation und -konfiguration für das Training und die Auswertung der Standard-Datensätze für 3D-Szenenverständnis.
Laut Google-Forscher Alireza Fathi ermöglicht Tensorflow 3D eine Vielzahl von 3D-Deep-Learning-Forschung und -Anwendungen, "vom schnellen Prototyping und Ausprobieren neuer Ideen bis hin zum Einsatz eines Echtzeit-Inferenzsystems".
Tensorflow 3D ist Open Source und kostenlos bei Github verfügbar. Wie das Standard-Tensorflow dürfte die 3D-Version Grundlage einer Vielzahl an KI-Anwendungen werden.
Quelle: Google