ChatGPT-Operator surft selbstständig durchs Netz, macht aber noch zu viele Fehler

Automatisiert der ChatGPT-Operator endlich die Browserbenutzung? Erste Tests von Nutzer:innen machen Hoffnung darauf, mit natürlicher Sprache durchs Web zu navigieren, zeigen jedoch auch die kaum überraschenden Probleme auf.

Nach der Veröffentlichung des Agentensystems ChatGPT Operator von OpenAI finden sich auf Social Media und an anderen Stellen des Internets erste Erfahrungsberichte US-amerikanischer Pro-Nutzer:innen, die bislang als einzige Zugriff auf das Werkzeug haben.

Während des Livestreams, in dem CEO Sam Altman zusammen mit OpenAI-Entwicklern den ChatGPT Operator präsentierte, zeigten sie verschiedene, für derartige KI-Agenten gern genutzte Anwendungsfälle: Tischreservierung im Restaurant, Reiseplanung, Pizzabestellung. Aber wie sieht es mit spezifischeren Anwendungsfällen aus? Wir haben uns umgeschaut und Antworten gesammelt.

Operator sucht Stellenanzeigen und testet Web-Apps

Dan Mac demonstriert in einem Video auf X wie der Operator mithilfe von seinem Lebenslauf als PDF selbstständig nach passenden Jobs sucht. Dabei habe der Agent sogar eine passende Stelle gefunden, auf die sich Mac bewerben würde, wenn er auf Jobsuche wäre. Trotz des frühen Entwicklungsstadiums und der noch langsamen Arbeitsgeschwindigkeit habe der Operator seine Aufgabe gut erfüllt.

Video: Dan Mac/X

Softwareentwickler Kieran Klaassen sieht im ChatGPT-Operator eine vielversprechende Lösung, um lokale Entwicklungsumgebungen zu testen.

Video: Kieran Klaassen/X

Nach 40 Minuten des Testens zeigt sich Alex Volkov beeindruckt von der Benutzerfreundlichkeit und den Fähigkeiten des ChatGPT Operators, sieht aber auch noch Verbesserungspotenzial. Positiv hebt er die Möglichkeit hervor, mehrere Aufgaben gleichzeitig auszuführen und zu organisieren sowie die Fähigkeit des Operators, Konzepte wie das Zitieren eines Tweets zu verstehen.

Allerdings habe es Probleme mit der Speicherung von Cookies zwischen den Sitzungen gegeben und manche Aufgaben dauerten unerwartet lange. An einer Stelle fragte der Operator, ob er den Chat weiter überwachen solle, obwohl nichts mehr passierte - möglicherweise eine "halluzinierte" Fähigkeit.

Operator kontaktiert Facebook-Verkäufer auf Autopilot

Der Unternehmer Chris Koerner sieht in dem Operator die Grundlage für ein mögliches "Six-Figure-Business". In einem Demo-Video testet er die Fähigkeiten des Systems, Personen über den Facebook Marketplace anzuschreiben, die in einem bestimmten Umkreis ein Klavier verschenken, und bietet ihnen eine Abholung gegen eine Gebühr von 200 US-Dollar an.

Nach entsprechendem Prompt, nicht mehr vor jeder Nachricht Koerner um Erlaubnis zu bitten, führte der Operator die Aufgabe tatsächlich selbstständig durch und protokollierte die Anfragen in einem Google Sheet.

Video: Chris Koerner/X

Operator versagt bei Influencer-Recherche

Ein ausführlicher Erfahrungsbericht eines Reddit-Nutzers deckt Schwächen des ChatGPT Operators auf. Der Agent sollte eine Liste von 50 populären Finanz-Influencer:innen auf YouTube erstellen, inklusive deren LinkedIn-Profilen, E-Mail-Adressen und Zusammenfassungen ihrer Kanäle.

Zunächst war er beeindruckt, wie der Operator selbstständig einen Webbrowser öffnete. Statt auf YouTube oder einer anderen Social-Media-Plattform suchte er jedoch auf Bing nach Influencer:innen. Nach kurzer Zeit zeigten sich weitere Probleme: Der Agent hatte Schwierigkeiten, eine geeignete Tabellenkalkulation zu finden und begann, Informationen "schlimmer als GPT-3" zu halluzinieren.

Tabellenansicht einer Spreadsheet-Datei mit Liste von Finanz-Influencern, deren Kontaktdaten und Kanalbeschreibungen zu verschiedenen Finanzthemen. — Um eine Liste von Influencer:innen zu erstellen, nutzt der Operator Microsoft-Suchmaschine Bing - aber kommt nicht auf die Idee, für eine Tabelle auf Excel zurückzugreifen.

Nach 20 Minuten brach der Nutzer den Test ab. Das Ergebnis: eine unvollständige Tabelle auf einer zwielichtigen Office-Website mit nur 18 statt 50 Influencer:innen und falschen Kontaktdaten. Auch die Arbeitsgeschwindigkeit des Operators sei zu langsam gewesen.

Operator angeblich bereits von manchen Websites geblockt

Dem Posting eines Users im r/webdev-Subreddit zufolge hätten manche Websites die Nutzung des ChatGPT Operators bereits geblockt. Massenhaft Preisangaben von Ebay zu sammeln sei mit dem Operator etwa nicht möglich.

Wie diese Sperre technisch vonstattengehen soll, ist jedoch noch unklar. Andere OpenAI-Bots werden in der Regel über die robots.txt einer Website ausgeschlossen, für den Operator existiert noch kein entsprechender Parameter. Der Operator besucht Webseiten wohl über einen virtuellen Chrome-Browser und die IP eines Microsoft-Azure-Servers.

Da OpenAI in der offiziellen Präsentation als Beispielaufgabe des Operators die Suche nach Produkten auf Ebay zeigt, ist davon auszugehen, dass es sich im Fall des Reddit-Nutzers nicht um eine konkrete Blockade des Operators handelt, sondern eher allgemeine Schutzmechanismen gegen Bots greifen.

Empfehlung

KI in der Praxis

MIT-Studie zeigt "kognitive Schulden" durch ChatGPT - was das für die Praxis bedeutet

Auch Reddit selbst scheint Maßnahmen gegen solche automatisierten Zugriffe ergriffen zu haben. X-Nutzer Rowan Cheung demonstriert in einer Bildschirmaufnahme, wie der Operator die Blockade durch eine Bing-Suche eigenständig umgeht.

Video: Rowan Cheung/X

Auf den ersten Blick beeindruckend, auf den zweiten nicht

Generell scheint der ChatGPT-Operator nach diesen Erfahrungsberichten die Grundprämisse zu erfüllen, selbstständig durch das Internet navigieren zu können. Dass das besser funktioniert als bei den bisherigen Ansätzen, liegt vermutlich unter anderem daran, dass das System nicht nur auf das DOM einer Webseite zurückgreift, sondern zusätzlich Screenshots durch das multimodale GPT-4o auswertet.

Wie bei älteren Agentensystemen zeigen sich Tester:innen im ersten Augenblick beeindruckt von der Selbstständigkeit. Noch macht der Operator jedoch zu viele Fehler, als dass sich menschliche Anwender:innen bei wichtigen Aufgaben auf ihn verlassen könnten, ohne ihn permanent überwachen zu müssen.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

ChatGPT-Operator surft selbstständig durchs Netz, macht aber noch zu viele Fehler

Operator sucht Stellenanzeigen und testet Web-Apps

Operator kontaktiert Facebook-Verkäufer auf Autopilot

Operator versagt bei Influencer-Recherche

Operator angeblich bereits von manchen Websites geblockt

MIT-Studie zeigt "kognitive Schulden" durch ChatGPT - was das für die Praxis bedeutet

Auf den ersten Blick beeindruckend, auf den zweiten nicht

Perplexity soll jetzt 18 Milliarden Dollar wert sein

OpenAI-Chef warnt vor dem Einsatz von ChatGPT-Agent für wichtige Aufgaben

Meta wirbt erneut Top-KI-Forscher von Apple ab - Millionen-Gehälter locken

ChatGPT Agent: OpenAI stattet ChatGPT mit autonomen Agenten-Fähigkeiten aus

Kimi K2: Das nächste Open-Model-Wunder nach Deepseek kommt wieder aus China

Neue KI-Architektur verspricht besseres "System 2-Denken"

ChatGPT-Operator surft selbstständig durchs Netz, macht aber noch zu viele Fehler

Operator sucht Stellenanzeigen und testet Web-Apps

Operator kontaktiert Facebook-Verkäufer auf Autopilot

Operator versagt bei Influencer-Recherche

Operator angeblich bereits von manchen Websites geblockt

Auf den ersten Blick beeindruckend, auf den zweiten nicht

Artikel teilen

Bankverbindung