Update vom 7. Januar 2025:
OpenAI könnte laut eines Berichts von The Information noch im Januar seinen computernutzenden KI-Agenten "Operator" veröffentlichen. Das Tech-Magazin bestätigt damit einen Bericht von Bloomberg vom vergangenen November (siehe unten).
Ein OpenAI-Mitarbeiter gab an, dass Sicherheitsbedenken bezüglich sogenannter "Prompt Injections" den Start verzögert hätten. Das Risiko einer Prompt Injection sei bei autonom agierenden KI-Agenten noch größer, da hier weniger Kontrolle darüber besteht, welche Inhalte verarbeitet werden.
Bei dieser Sicherheitslücke, die seit mindestens GPT-3 bekannt ist, versuchen Nutzer durch geschickt formulierte Prompts das Verhalten des KI-Systems zu manipulieren. Bisher gibt es keine zuverlässige Methode, um Prompt Injections vollständig zu verhindern.
OpenAI-Mitgründer Wojciech Zaremba kritisierte Anthropic kürzlich dafür, dass es seinen KI-Agenten ohne Sicherheitsvorkehrungen veröffentlichte. Für das gleiche Vorgehen würde OpenAI "massiven Hass" ernten, so Zaremba.
Ursprünglicher Artikel vom 14. November 2024:
OpenAI plant angeblich KI-Agenten "Operator" für Januar-Launch
OpenAI plant im Januar einen KI-Agenten namens "Operator" vorzustellen, der selbstständig Computeraufgaben ausführen kann. Das Unternehmen folgt damit einem Branchentrend zur Automatisierung komplexer Arbeitsabläufe.
Wie Bloomberg unter Berufung auf zwei Insider berichtet, plant OpenAI für Januar die Einführung eines KI-Agentensystems mit dem Codenamen "Operator". Das System soll in der Lage sein, eigenständig Computeraufgaben auszuführen, etwa Code zu schreiben oder Reisen zu buchen.
Nach Angaben einer der Quellen kündigte die OpenAI-Führung in einem internen Meeting an, das Tool zunächst als Forschungsvorschau und über eine API für Entwickler zur Verfügung zu stellen. Der "Operator" ist als Allzweck-Agent konzipiert, wird aber für die Browser-Nutzung optimiert sein.
OpenAI-CEO Sam Altman sieht in KI-Agenten den nächsten Wachstumshorizont für künstliche Intelligenz. Ein Grund dafür könnte die Stagnation bei der Entwicklung herkömmlicher Sprachmodelle sein. Laut Altman geht es künftig darum, existierende Modelle intelligenter einzusetzen.
Wettlauf um automatisierte KI-Assistenten
Die Initiative von OpenAI ist Teil eines branchenweiten Trends zu KI-Agenten, die mit minimaler Aufsicht mehrstufige Aufgaben für Nutzer ausführen können.
Anthropic hat bereits einen ähnlichen Agenten vorgestellt, der Bildschirminhalte in Echtzeit verarbeiten und Aktionen ausführen kann. Microsoft bietet bei Copilot erste Automatisierungswerkzeuge an.
Auch Google entwickelt mit "Project Jarvis" einen KI-Assistenten, der im Chrome-Browser navigieren und Aufgaben wie Produktkäufe oder Flugbuchungen ausführen soll. Das System soll im Dezember zusammen mit dem neuen Sprachmodell Gemini vorgestellt werden.
Agentische KI-Systeme sind kleine Programme oder Prompts, die einzelne Teilaufgaben bearbeiten und an weitere Agenten übergeben können. Die Verknüpfung vieler Agenten, die verlässlich Einzelaufgaben erledigen, soll die Automatisierung ganzer Arbeitsprozesse ermöglichen.
Mit "Project Swarm" veröffentlichte OpenAI ein erstes experimentelles Open-Source-Framework auf GitHub, das der Erstellung und Orchestrierung von Multi-Agenten-Systemen dient. Das Framework demonstriert, wie Agenten die Kontrolle über Gespräche untereinander übergeben und definierte Aufgabenschritte mit den notwendigen Werkzeugen ausführen können. Laut OpenAI dient es zur Demonstration des Agenten-Konzepts.