Inhalt
summary Zusammenfassung

Google arbeitet an einem KI-System namens "Project Jarvis", das selbstständig im Chrome-Browser navigieren und Aufgaben ausführen kann. Die Vorstellung ist noch für Dezember geplant.

Anzeige

Wie The Information unter Berufung auf drei Insider berichtet, entwickelt Google einen KI-Assistenten, der den Webbrowser von Nutzern steuern und alltägliche Aufgaben automatisch ausführen soll.

Der KI-Agent soll nach Angaben der Quellen in der Lage sein, selbstständig Recherchen durchzuführen, Produkte zu kaufen oder Flüge zu buchen. Die Technologie ähnelt dabei dem kürzlich von Anthropic präsentierten Computer-Agenten.

Das als "Project Jarvis" bezeichnete System soll bereits im Dezember zusammen mit dem neuen Sprachmodell Gemini vorgestellt werden. Die Pläne seien allerdings bisher nicht final.

Anzeige
Anzeige

Screenshots statt Programm-Zugriff

Technisch basiert Jarvis laut The Information auf einem ähnlichen Ansatz wie die Lösung von Anthropic: Die KI erstellt regelmäßig Screenshots vom Bildschirm, analysiert diese und führt dann entsprechende Aktionen wie Mausklicks oder Texteingaben aus.

Im Gegensatz zum Anthropic-System, das verschiedene Programme steuern kann, beschränkt sich Jarvis zunächst auf den Google Chrome Browser. Auch die Zielgruppe unterscheidet sich: Während Anthropic seinen Agenten für Entwickler und Büroarbeiter optimiert, zielt Google primär auf Verbraucher ab.

Die Insider berichten von aktuellen Einschränkungen: Der Agent arbeite noch relativ langsam, da das Modell vor jeder Aktion einige Sekunden "nachdenken" müsse. Zudem stehe Google vor der Herausforderung, Nutzer davon zu überzeugen, dem System sensible Daten wie Passwörter und Kreditkarteninformationen anzuvertrauen.

KI-Branche nimmt agentische KI in Angriff

The Information bestätigt damit die Meldung von The Verge, dass Google im Dezember sein neues Sprachmodell Gemini vorstellen will. Allerdings soll das Modell laut Insiderquellen von The Verge nicht die erhofften Leistungssprünge bringen.

Vielleicht auch, weil bei LLMs trotz Effizienzsteigerungen derzeit ein Plateau erreicht zu sein scheint, versuchen die Anbieter von KI-Modellen ihren Systemen neue Fähigkeiten beizubringen und diese in den Vordergrund zu stellen.

Empfehlung

Das Wort "Jarvis" tauchte bereits im Kontext der KI-Strategie von Google auf. Scott Jenson, ehemaliger UX-Stratege bei Google, kritisierte im Mai die KI-Pläne seines ehemaligen Arbeitgebers. Ziel sei es, so Jenson, einen Assistenten wie Jarvis zu schaffen, der die Nutzer an das Google-Ökosystem bindet - aus Angst, Konkurrenten könnten dies zuerst schaffen.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Google entwickelt einen KI-Assistenten namens "Project Jarvis", der selbstständig im Chrome-Browser navigieren und Aufgaben wie Recherchen, Produktkäufe oder Flugbuchungen ausführen können soll.
  • Jarvis erstellt regelmäßig Screenshots vom Bildschirm, analysiert diese und führt dann entsprechende Aktionen aus. Im Gegensatz zu ähnlichen Systemen beschränkt sich Jarvis zunächst auf den Chrome-Browser und zielt primär auf Verbraucher ab.
  • Aktuell arbeitet der Agent noch relativ langsam und Google steht vor der Herausforderung, Nutzer davon zu überzeugen, dem System sensible Daten anzuvertrauen. Die Vorstellung von Jarvis ist zusammen mit dem neuen Sprachmodell Gemini für Dezember geplant, die Pläne sind jedoch bisher nicht final.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!