Google arbeitet an einem KI-System namens "Project Jarvis", das selbstständig im Chrome-Browser navigieren und Aufgaben ausführen kann. Die Vorstellung ist noch für Dezember geplant.
Wie The Information unter Berufung auf drei Insider berichtet, entwickelt Google einen KI-Assistenten, der den Webbrowser von Nutzern steuern und alltägliche Aufgaben automatisch ausführen soll.
Der KI-Agent soll nach Angaben der Quellen in der Lage sein, selbstständig Recherchen durchzuführen, Produkte zu kaufen oder Flüge zu buchen. Die Technologie ähnelt dabei dem kürzlich von Anthropic präsentierten Computer-Agenten.
Das als "Project Jarvis" bezeichnete System soll bereits im Dezember zusammen mit dem neuen Sprachmodell Gemini vorgestellt werden. Die Pläne seien allerdings bisher nicht final.
Screenshots statt Programm-Zugriff
Technisch basiert Jarvis laut The Information auf einem ähnlichen Ansatz wie die Lösung von Anthropic: Die KI erstellt regelmäßig Screenshots vom Bildschirm, analysiert diese und führt dann entsprechende Aktionen wie Mausklicks oder Texteingaben aus.
Im Gegensatz zum Anthropic-System, das verschiedene Programme steuern kann, beschränkt sich Jarvis zunächst auf den Google Chrome Browser. Auch die Zielgruppe unterscheidet sich: Während Anthropic seinen Agenten für Entwickler und Büroarbeiter optimiert, zielt Google primär auf Verbraucher ab.
Die Insider berichten von aktuellen Einschränkungen: Der Agent arbeite noch relativ langsam, da das Modell vor jeder Aktion einige Sekunden "nachdenken" müsse. Zudem stehe Google vor der Herausforderung, Nutzer davon zu überzeugen, dem System sensible Daten wie Passwörter und Kreditkarteninformationen anzuvertrauen.
KI-Branche nimmt agentische KI in Angriff
The Information bestätigt damit die Meldung von The Verge, dass Google im Dezember sein neues Sprachmodell Gemini vorstellen will. Allerdings soll das Modell laut Insiderquellen von The Verge nicht die erhofften Leistungssprünge bringen.
Vielleicht auch, weil bei LLMs trotz Effizienzsteigerungen derzeit ein Plateau erreicht zu sein scheint, versuchen die Anbieter von KI-Modellen ihren Systemen neue Fähigkeiten beizubringen und diese in den Vordergrund zu stellen.
Das Wort "Jarvis" tauchte bereits im Kontext der KI-Strategie von Google auf. Scott Jenson, ehemaliger UX-Stratege bei Google, kritisierte im Mai die KI-Pläne seines ehemaligen Arbeitgebers. Ziel sei es, so Jenson, einen Assistenten wie Jarvis zu schaffen, der die Nutzer an das Google-Ökosystem bindet - aus Angst, Konkurrenten könnten dies zuerst schaffen.