KI in der Praxis

Google stellt private Sprachmodelle und KI-Gesichtsmaus fürs Gaming vor

Matthias Bastian
Ein Mann schaut in eine Webcam, aus Perspektive der Webcam, man sieht zahlreiche Trackingpunkte auf seinem Gesicht.

Google (Screenshot)

Google integriert KI in alle Produkte, darunter auch experimentelle Anwendungen wie "Gameface", eine Gesichtserkennungsmaus, und "Tailwind", ein Dienst für ein privates Sprachmodell, mit dem man über eigene Notizen chatten kann.

Neben den großen KI-Projekten rund um Chatbot und Suche sowie dem Sprachmodell PaLM 2 stellte Google auch zahlreiche kleinere KI-Anwendungen und -Experimente vor. Zwei davon sind Project Gameface, das maschinelles Sehen via Webcam zur Gesichtsverfolgung nutzt, und Project Tailwind, ein KI-Notizbuch, das aus Google-Drive-Dokumenten lernt.

Project Gameface ist eine Gesichtsmaus

Im Project Gameface nutzt Google die Webcam, um das Gesicht mausähnlich zu tracken. Dazu verwendet Google laut "Lead AI Advocate" Laurence Moroney eine Reihe verschiedener KI-Modelle, die insgesamt 468 Trackingpunkte auf das Gesicht projizieren.

Die Bewegungen dieser Tracking-Punkte werden über eine native Windows-Anwendung in Mausaktionen umgesetzt. So kann der Computer durch Gesichtsbewegungen gesteuert werden.

Zieht man beispielsweise den rechten Mundwinkel nach rechts, läuft die Spielfigur nach rechts. Wie genau das Gesicht den Computer steuert, kann über ein umfangreiches Optionsmenü fein eingestellt werden.

Derzeit unterstützt die Software sechs Gesichtsbewegungen, die Eingabe ist also noch recht eingeschränkt und nicht für komplexe Spiele geeignet. Gameface wurde in erster Linie für Menschen mit Behinderungen entwickelt. Die Software ist Open Source und auf Github mit Installationsanleitung verfügbar.

Tailwind: KI-Notizbuch basierend auf privatem Sprachmodell

Google bezeichnet Tailwind als "AI-first Notizbuch". Dazu trainiert es auf den eigenen in Google Drive gespeicherten Daten und Notizen ein privates Sprachmodell, mit dem man über eine Chatoberfläche mit den eigenen Inhalten interagieren kann, z.B. nach bestimmten Informationen, Inspirationen oder Zusammenfassungen fragen kann. Google nutzt für Tailwind die eigene PaLM 2 API.

Der Prototyp befindet sich laut Google noch in einer frühen Phase und wurde zunächst für Studierende konzipiert und getestet. Das Prinzip hinter Tailwind sei allerdings für viele Zielgruppen relevant, von Autor:innen über Finanzanalyst:innen bis zu Jurist:innen, die über ein Chat-Interface mit ihren eigenen Inhalten interagieren wollen (Demo startet bei 1:05:00).

 

Google beschreibt Tailwind als Experiment, das "in den vergangenen Wochen" von fünf Google-Fachkräften entwickelt wurde. In den USA kann man sich auf eine Warteliste für den Zugang setzen lassen, wenn man für die Google Labs Experimente zugelassen ist.

Tailwind ist insofern interessant, als es in Zukunft für Einzelpersonen oder Unternehmen deutlich einfacher werden dürfte, Zugang zu individualisierten Sprachmodellen zu erhalten. Auch der Chef von OpenAI, Sam Altman, hat angekündigt, dass sein Unternehmen in Zukunft individualisierbare ChatGPT-Modelle anbieten will.