Project Jarvis: Auch Google will mit KI den Browser steuern

27. Oktober 2024

Midjourney prompted by THE DECODER

Google arbeitet an einem KI-System namens "Project Jarvis", das selbstständig im Chrome-Browser navigieren und Aufgaben ausführen kann. Die Vorstellung ist noch für Dezember geplant.

Wie The Information unter Berufung auf drei Insider berichtet, entwickelt Google einen KI-Assistenten, der den Webbrowser von Nutzern steuern und alltägliche Aufgaben automatisch ausführen soll.

Der KI-Agent soll nach Angaben der Quellen in der Lage sein, selbstständig Recherchen durchzuführen, Produkte zu kaufen oder Flüge zu buchen. Die Technologie ähnelt dabei dem kürzlich von Anthropic präsentierten Computer-Agenten.

Das als "Project Jarvis" bezeichnete System soll bereits im Dezember zusammen mit dem neuen Sprachmodell Gemini vorgestellt werden. Die Pläne seien allerdings bisher nicht final.

Screenshots statt Programm-Zugriff

Technisch basiert Jarvis laut The Information auf einem ähnlichen Ansatz wie die Lösung von Anthropic: Die KI erstellt regelmäßig Screenshots vom Bildschirm, analysiert diese und führt dann entsprechende Aktionen wie Mausklicks oder Texteingaben aus.

Im Gegensatz zum Anthropic-System, das verschiedene Programme steuern kann, beschränkt sich Jarvis zunächst auf den Google Chrome Browser. Auch die Zielgruppe unterscheidet sich: Während Anthropic seinen Agenten für Entwickler und Büroarbeiter optimiert, zielt Google primär auf Verbraucher ab.

Die Insider berichten von aktuellen Einschränkungen: Der Agent arbeite noch relativ langsam, da das Modell vor jeder Aktion einige Sekunden "nachdenken" müsse. Zudem stehe Google vor der Herausforderung, Nutzer davon zu überzeugen, dem System sensible Daten wie Passwörter und Kreditkarteninformationen anzuvertrauen.

KI-Branche nimmt agentische KI in Angriff

The Information bestätigt damit die Meldung von The Verge, dass Google im Dezember sein neues Sprachmodell Gemini vorstellen will. Allerdings soll das Modell laut Insiderquellen von The Verge nicht die erhofften Leistungssprünge bringen.

Vielleicht auch, weil bei LLMs trotz Effizienzsteigerungen derzeit ein Plateau erreicht zu sein scheint, versuchen die Anbieter von KI-Modellen ihren Systemen neue Fähigkeiten beizubringen und diese in den Vordergrund zu stellen.

Das Wort "Jarvis" tauchte bereits im Kontext der KI-Strategie von Google auf. Scott Jenson, ehemaliger UX-Stratege bei Google, kritisierte im Mai die KI-Pläne seines ehemaligen Arbeitgebers. Ziel sei es, so Jenson, einen Assistenten wie Jarvis zu schaffen, der die Nutzer an das Google-Ökosystem bindet - aus Angst, Konkurrenten könnten dies zuerst schaffen.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: The Information

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Project Jarvis: Auch Google will mit KI den Browser steuern

Screenshots statt Programm-Zugriff

KI-Branche nimmt agentische KI in Angriff

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.