Inhalt
summary Zusammenfassung

Sprachmodelle beschleunigen und automatisieren viele Aufgaben in Bereichen wie Text oder Code. Was passiert, wenn sie sich selbst steuern?

Anzeige

Dieser neue Trend in der generativen KI wird auch "Self-Prompting" oder "Auto-Prompting" genannt: Auf Basis einer ersten Eingabe entwickelt das Sprachmodell weitere Prompts, die es dann ausführt, die wieder zu neuen Prompts führen können.

Wirklich mächtig wird dieser Ansatz, sobald er mit Werkzeugen wie der Internetsuche oder der Fähigkeit, geschriebenen Code zu testen, verknüpft wird. Das Sprachmodell wird so zu einem automatischen Assistenten, der weit mehr kann als nur Text oder Code zu generieren.

"Ein GPT-Aufruf ist ein bisschen wie ein Gedanke. Wenn man sie in einer Schleife aneinanderreiht, erhält man Agenten, die wahrnehmen, denken und handeln können, wobei ihre Ziele in englischsprachigen Aufforderungen definiert sind", schreibt OpenAI-Entwickler Andrej Karpathy und prophezeit eine Zukunft mit "AutoOrgs", die aus "AutoCEOs", "AutoCFOs" und so weiter bestehen.

Anzeige
Anzeige

Auto-GPT: GPT-4 auf Autopilot

Das derzeit populärste Beispiel ist die experimentelle Open-Source-Anwendung "Auto-GPT". Die Python-Anwendung wurde nach Angaben des Github-Teams entwickelt, um selbstständig Geschäftsideen zu entwickeln, zu managen und so Einnahmen zu generieren.

Dabei plant das Programm Schritt für Schritt, begründet Entscheidungen und entwickelt Pläne, die es dokumentiert. Neben der Integration von GPT-4 zur Textgenerierung verfügt das System über einen Internetzugang zur Datenbeschaffung, kann Daten speichern und über die Elevenlabs-API Sprache generieren.

Inzwischen soll die Software sogar in der Lage sein, sich selbst weiterzuentwickeln und Fehler zu beheben, indem sie Python-Skripte über GPT-4 generiert.

Die folgende Demo zeigt, wie das System als "Chef-GPT" selbstständig nach anstehenden Ereignissen recherchiert, dabei den "Tag der Erde" identifiziert und eine ausgefallene Rezeptidee passend zu diesem Tag generiert.

Video: Auto-GPT-4, Github

Empfehlung

Vom Sprachmodell zum Alltagshelfer

Die Idee hinter Auto-GPT und ähnlichen Projekten wie Baby-AGI oder Jarvis (HuggingGPT) ist die Vernetzung von Sprachmodellen und Funktionen zur automatisierten Bearbeitung komplexer Aufgaben. Das Sprachmodell fungiert dabei als eine Art Controller, der andere Sprach- oder Expertenmodelle und Werkzeuge automatisiert einsetzt, um ein vorgegebenes Ziel möglichst selbstständig zu erreichen.

"Durch die Nutzung der leistungsstarken Sprachfähigkeiten von ChatGPT und der zahlreichen KI-Modelle in Hugging Face ist HuggingGPT in der Lage, eine Vielzahl anspruchsvoller KI-Aufgaben in verschiedenen Modalitäten und Domänen abzudecken und beeindruckende Ergebnisse in den Bereichen Sprache, Sehen, Sprechen und anderen anspruchsvollen Aufgaben zu erzielen", schreibt das Team hinter HuggingGPT, das eine ähnliche Idee verfolgt.

Sprachmodelle als Computer-Plattform

Die Idee, Sprachmodelle über reine Textgenerierung hinaus einzusetzen, ist nicht neu: Das Start-up Adept etwa arbeitet an einer universellen Textsteuerung, mit der ein Modell allein durch Sprachbefehle zum Beispiel eine Webseite durchsuchen, in Wikipedia recherchieren oder Excel bedienen kann. Mit den ChatGPT-Plugins hat OpenAI ein Konzept mit ähnlichem Automatisierungspotenzial bereits offiziell als kommendes Feature vorgestellt.

Erste Experimente zeigen, dass auch Roboter vom Sprachverständnis und Weltwissen großer Sprachmodelle profitieren können. So steuert Google Haushaltsroboter per natürlicher Sprache, die Sprachverstehen mit Umgebungs- und Objekterkennung kombinieren können, um mehrstufige Aktionen auszuführen, ohne dass diese vorher programmiert werden müssen. Das folgende Beispiel zeigt einen einfachen selbstgebauten Roboter, der dank GPT-4-Anbindung humorvoll auf komplexe Befehle in natürlicher Sprache reagieren kann.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Interessant ist auch der Einsatz von Auto-Prompting für Brainstorming: Aus einer Themeneingabe generiert GPT-4 weitere Prompts, die zu neuen Prompts führen und so weiter - die Ergebnisse werden von einer Software in einer Mindmap-Struktur festgehalten. Der Entwickler nennt das "Brainstorming auf Steroiden".

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Sprachmodelle könnten mehr sein als Textmaschinen: Indem sie eigene Prompts generieren und ausführen, steuern sie sich selbst zu einem vorgegebenen Ziel.
  • Derzeit gibt es eine Reihe von Experimenten wie Auto-GPT, die versuchen, Sprachmodelle auf diese Weise zu nutzen. Auch ChatGPT-Plugins setzen auf die Steuerungsfunktion großer Sprachmodelle.
  • Sprachmodelle helfen durch ihr Sprachverständnis auch als universelle Computerassistenten oder in der Robotik bei der Steuerung von Alltagsrobotern.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!