ChatGPTs KI-Agent "Operator" soll noch in dieser Woche starten

22. Januar 2025

Midjourney prompted by THE DECODER

Update vom 22. Januar 2025:

Laut einer Quelle von The Information soll "Operator" noch in dieser Woche als ChatGPT-Funktion für die Browser-Steuerung starten.

Der Operator soll verschiedene Aufgabenkategorien anbieten, wie Essen und Veranstaltungen, Lieferung, Einkaufen und Reisen, sowie innerhalb jeder Kategorie vorgeschlagene Prompts.

Bei der Eingabe eines Prompts öffnet sich ein Minibildschirm im Chatbot, der einen Browser und die Aktionen des Operator-Agenten anzeigt. Der Agent fragt bei Bedarf nach, beispielsweise nach der Uhrzeit und der Anzahl der Personen bei einer Restaurantreservierung.

ChatGPT-Benutzer können die Kontrolle über den Bildschirm übernehmen, während der Operator arbeitet. Zudem können sie die Aufgaben des Operators speichern und mit anderen Benutzern teilen. Der Operator kann auch auf Webseiten zugreifen, die eine Anmeldung erfordern, wenn der Benutzer angemeldet ist - mit Ausnahme von Googles Gmail.

Update vom 7. Januar 2025:

OpenAI könnte laut eines Berichts von The Information noch im Januar seinen computernutzenden KI-Agenten "Operator" veröffentlichen. Das Tech-Magazin bestätigt damit einen Bericht von Bloomberg vom vergangenen November (siehe unten).

Ein OpenAI-Mitarbeiter gab an, dass Sicherheitsbedenken bezüglich sogenannter "Prompt Injections" den Start verzögert hätten. Das Risiko einer Prompt Injection sei bei autonom agierenden KI-Agenten noch größer, da hier weniger Kontrolle darüber besteht, welche Inhalte verarbeitet werden.

Bei dieser Sicherheitslücke, die seit mindestens GPT-3 bekannt ist, versuchen Nutzer durch geschickt formulierte Prompts das Verhalten des KI-Systems zu manipulieren. Bisher gibt es keine zuverlässige Methode, um Prompt Injections vollständig zu verhindern.

OpenAI-Mitgründer Wojciech Zaremba kritisierte Anthropic kürzlich dafür, dass es seinen KI-Agenten ohne Sicherheitsvorkehrungen veröffentlichte. Für das gleiche Vorgehen würde OpenAI "massiven Hass" ernten, so Zaremba.

Ursprünglicher Artikel vom 14. November 2024:

OpenAI plant angeblich KI-Agenten "Operator" für Januar-Launch

OpenAI plant im Januar einen KI-Agenten namens "Operator" vorzustellen, der selbstständig Computeraufgaben ausführen kann. Das Unternehmen folgt damit einem Branchentrend zur Automatisierung komplexer Arbeitsabläufe.

Wie Bloomberg unter Berufung auf zwei Insider berichtet, plant OpenAI für Januar die Einführung eines KI-Agentensystems mit dem Codenamen "Operator". Das System soll in der Lage sein, eigenständig Computeraufgaben auszuführen, etwa Code zu schreiben oder Reisen zu buchen.

Nach Angaben einer der Quellen kündigte die OpenAI-Führung in einem internen Meeting an, das Tool zunächst als Forschungsvorschau und über eine API für Entwickler zur Verfügung zu stellen. Der "Operator" ist als Allzweck-Agent konzipiert, wird aber für die Browser-Nutzung optimiert sein.

OpenAI-CEO Sam Altman sieht in KI-Agenten den nächsten Wachstumshorizont für künstliche Intelligenz. Ein Grund dafür könnte die Stagnation bei der Entwicklung herkömmlicher Sprachmodelle sein. Laut Altman geht es künftig darum, existierende Modelle intelligenter einzusetzen.

Wettlauf um automatisierte KI-Assistenten

Die Initiative von OpenAI ist Teil eines branchenweiten Trends zu KI-Agenten, die mit minimaler Aufsicht mehrstufige Aufgaben für Nutzer ausführen können.

Anthropic hat bereits einen ähnlichen Agenten vorgestellt, der Bildschirminhalte in Echtzeit verarbeiten und Aktionen ausführen kann. Microsoft bietet bei Copilot erste Automatisierungswerkzeuge an.

Auch Google entwickelt mit "Project Jarvis" einen KI-Assistenten, der im Chrome-Browser navigieren und Aufgaben wie Produktkäufe oder Flugbuchungen ausführen soll. Das System soll im Dezember zusammen mit dem neuen Sprachmodell Gemini vorgestellt werden.

Agentische KI-Systeme sind kleine Programme oder Prompts, die einzelne Teilaufgaben bearbeiten und an weitere Agenten übergeben können. Die Verknüpfung vieler Agenten, die verlässlich Einzelaufgaben erledigen, soll die Automatisierung ganzer Arbeitsprozesse ermöglichen.

Mit "Project Swarm" veröffentlichte OpenAI ein erstes experimentelles Open-Source-Framework auf GitHub, das der Erstellung und Orchestrierung von Multi-Agenten-Systemen dient. Das Framework demonstriert, wie Agenten die Kontrolle über Gespräche untereinander übergeben und definierte Aufgabenschritte mit den notwendigen Werkzeugen ausführen können. Laut OpenAI dient es zur Demonstration des Agenten-Konzepts.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

ChatGPTs KI-Agent "Operator" soll noch in dieser Woche starten

OpenAI plant angeblich KI-Agenten "Operator" für Januar-Launch

Wettlauf um automatisierte KI-Assistenten

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.