OpenAI plant im Januar einen KI-Agenten namens "Operator" vorzustellen, der selbstständig Computeraufgaben ausführen kann. Das Unternehmen folgt damit einem Branchentrend zur Automatisierung komplexer Arbeitsabläufe.
Wie Bloomberg unter Berufung auf zwei Insider berichtet, plant OpenAI für Januar die Einführung eines KI-Agentensystems mit dem Codenamen "Operator". Das System soll in der Lage sein, eigenständig Computeraufgaben auszuführen, etwa Code zu schreiben oder Reisen zu buchen.
Nach Angaben einer der Quellen kündigte die OpenAI-Führung in einem internen Meeting an, das Tool zunächst als Forschungsvorschau und über eine API für Entwickler zur Verfügung zu stellen. Der "Operator" ist als Allzweck-Agent konzipiert, wird aber für die Browser-Nutzung optimiert sein.
OpenAI-CEO Sam Altman sieht in KI-Agenten den nächsten Wachstumshorizont für künstliche Intelligenz. Ein Grund dafür könnte die Stagnation bei der Entwicklung herkömmlicher Sprachmodelle sein. Laut Altman geht es künftig darum, existierende Modelle intelligenter einzusetzen.
Wettlauf um automatisierte KI-Assistenten
Die Initiative von OpenAI ist Teil eines branchenweiten Trends zu KI-Agenten, die mit minimaler Aufsicht mehrstufige Aufgaben für Nutzer ausführen können.
Anthropic hat bereits einen ähnlichen Agenten vorgestellt, der Bildschirminhalte in Echtzeit verarbeiten und Aktionen ausführen kann. Microsoft bietet bei Copilot erste Automatisierungswerkzeuge an.
Auch Google entwickelt mit "Project Jarvis" einen KI-Assistenten, der im Chrome-Browser navigieren und Aufgaben wie Produktkäufe oder Flugbuchungen ausführen soll. Das System soll im Dezember zusammen mit dem neuen Sprachmodell Gemini vorgestellt werden.
Agentische KI-Systeme sind kleine Programme oder Prompts, die einzelne Teilaufgaben bearbeiten und an weitere Agenten übergeben können. Die Verknüpfung vieler Agenten, die verlässlich Einzelaufgaben erledigen, soll die Automatisierung ganzer Arbeitsprozesse ermöglichen.
Mit "Project Swarm" veröffentlichte OpenAI ein erstes experimentelles Open-Source-Framework auf GitHub, das der Erstellung und Orchestrierung von Multi-Agenten-Systemen dient. Das Framework demonstriert, wie Agenten die Kontrolle über Gespräche untereinander übergeben und definierte Aufgabenschritte mit den notwendigen Werkzeugen ausführen können. Laut OpenAI dient es zur Demonstration des Agenten-Konzepts.