AutoGPT: Self-Prompting automatisiert große Sprachmodelle

7. April 2023

Midjourney prompted by THE DECODER

Sprachmodelle beschleunigen und automatisieren viele Aufgaben in Bereichen wie Text oder Code. Was passiert, wenn sie sich selbst steuern?

Dieser neue Trend in der generativen KI wird auch "Self-Prompting" oder "Auto-Prompting" genannt: Auf Basis einer ersten Eingabe entwickelt das Sprachmodell weitere Prompts, die es dann ausführt, die wieder zu neuen Prompts führen können.

Wirklich mächtig wird dieser Ansatz, sobald er mit Werkzeugen wie der Internetsuche oder der Fähigkeit, geschriebenen Code zu testen, verknüpft wird. Das Sprachmodell wird so zu einem automatischen Assistenten, der weit mehr kann als nur Text oder Code zu generieren.

"Ein GPT-Aufruf ist ein bisschen wie ein Gedanke. Wenn man sie in einer Schleife aneinanderreiht, erhält man Agenten, die wahrnehmen, denken und handeln können, wobei ihre Ziele in englischsprachigen Aufforderungen definiert sind", schreibt OpenAI-Entwickler Andrej Karpathy und prophezeit eine Zukunft mit "AutoOrgs", die aus "AutoCEOs", "AutoCFOs" und so weiter bestehen.

Auto-GPT: GPT-4 auf Autopilot

Das derzeit populärste Beispiel ist die experimentelle Open-Source-Anwendung "Auto-GPT". Die Python-Anwendung wurde nach Angaben des Github-Teams entwickelt, um selbstständig Geschäftsideen zu entwickeln, zu managen und so Einnahmen zu generieren.

Dabei plant das Programm Schritt für Schritt, begründet Entscheidungen und entwickelt Pläne, die es dokumentiert. Neben der Integration von GPT-4 zur Textgenerierung verfügt das System über einen Internetzugang zur Datenbeschaffung, kann Daten speichern und über die Elevenlabs-API Sprache generieren.

Inzwischen soll die Software sogar in der Lage sein, sich selbst weiterzuentwickeln und Fehler zu beheben, indem sie Python-Skripte über GPT-4 generiert.

Massive Update for Auto-GPT: Code Execution! 🤖💻

Auto-GPT is now able to write it's own code using #gpt4 and execute python scripts!

This allows it to recursively debug, develop and self-improve... 🤯 👇 pic.twitter.com/GEkMb1LyxV

— Toran Bruce Richards (@SigGravitas) April 1, 2023

Die folgende Demo zeigt, wie das System als "Chef-GPT" selbstständig nach anstehenden Ereignissen recherchiert, dabei den "Tag der Erde" identifiziert und eine ausgefallene Rezeptidee passend zu diesem Tag generiert.

Video: Auto-GPT-4, Github

Vom Sprachmodell zum Alltagshelfer

Die Idee hinter Auto-GPT und ähnlichen Projekten wie Baby-AGI oder Jarvis (HuggingGPT) ist die Vernetzung von Sprachmodellen und Funktionen zur automatisierten Bearbeitung komplexer Aufgaben. Das Sprachmodell fungiert dabei als eine Art Controller, der andere Sprach- oder Expertenmodelle und Werkzeuge automatisiert einsetzt, um ein vorgegebenes Ziel möglichst selbstständig zu erreichen.

"Durch die Nutzung der leistungsstarken Sprachfähigkeiten von ChatGPT und der zahlreichen KI-Modelle in Hugging Face ist HuggingGPT in der Lage, eine Vielzahl anspruchsvoller KI-Aufgaben in verschiedenen Modalitäten und Domänen abzudecken und beeindruckende Ergebnisse in den Bereichen Sprache, Sehen, Sprechen und anderen anspruchsvollen Aufgaben zu erzielen", schreibt das Team hinter HuggingGPT, das eine ähnliche Idee verfolgt.

Sprachmodelle als Computer-Plattform

Die Idee, Sprachmodelle über reine Textgenerierung hinaus einzusetzen, ist nicht neu: Das Start-up Adept etwa arbeitet an einer universellen Textsteuerung, mit der ein Modell allein durch Sprachbefehle zum Beispiel eine Webseite durchsuchen, in Wikipedia recherchieren oder Excel bedienen kann. Mit den ChatGPT-Plugins hat OpenAI ein Konzept mit ähnlichem Automatisierungspotenzial bereits offiziell als kommendes Feature vorgestellt.

Erste Experimente zeigen, dass auch Roboter vom Sprachverständnis und Weltwissen großer Sprachmodelle profitieren können. So steuert Google Haushaltsroboter per natürlicher Sprache, die Sprachverstehen mit Umgebungs- und Objekterkennung kombinieren können, um mehrstufige Aktionen auszuführen, ohne dass diese vorher programmiert werden müssen. Das folgende Beispiel zeigt einen einfachen selbstgebauten Roboter, der dank GPT-4-Anbindung humorvoll auf komplexe Befehle in natürlicher Sprache reagieren kann.

Interessant ist auch der Einsatz von Auto-Prompting für Brainstorming: Aus einer Themeneingabe generiert GPT-4 weitere Prompts, die zu neuen Prompts führen und so weiter - die Ergebnisse werden von einer Software in einer Mindmap-Struktur festgehalten. Der Entwickler nennt das "Brainstorming auf Steroiden".

AI will unlock human creativity even more 🚀

When you give a certain topic, it generates infinite prompts on that topic.

This is brainstorming on absolute steroids, almost cheating!

This is a force-directed knowledge graph interface for GPT4 made by hturan pic.twitter.com/WzyVeRK5D9

— CHEF 🇫🇷 🇨🇦 Ph.D.🎓 Proud Canadian! (@Neo19890) April 2, 2023

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren