Inhalt
summary Zusammenfassung

Manche KI-Experten, auch selbst ernannte, überbieten sich derzeit mit Prognosen über KI-Agenten. Doch was ein Agent ist und wann er wirklich einsatzbereit ist, darüber gehen die Meinungen auseinander.

Anzeige

Logan Kilpatrick, Produktleiter bei Google AI Studio und verantwortlich für Googles Gemini-API, macht auf X eine Ansage zur Entwicklung von KI-Fähigkeiten: Die meisten Anwendungsfälle für KI-Sehen (Vision) funktionierten bereits heute und seien bereit für den breiten Einsatz. 2025 werde daher das Jahr, in dem diese Vision-Fähigkeiten Mainstream werden.

Bei KI-Agenten sieht es laut Kilpatrick anders aus: Sie benötigen "noch etwas mehr Arbeit" für den Einsatz im Milliarden-Nutzer-Maßstab. Zwischen der technischen Machbarkeit und dem breiten Einsatz von KI-Fähigkeiten liege generell eine Lücke von etwa zwölf Monaten - daher seine Prognose, dass Agenten erst 2026 durchstarten werden.

Microsoft "CEO of AI" sieht es ähnlich

Diese vergleichsweise vorsichtige Einschätzung zu Agenten wird von Microsofts "CEO of AI" Mustafa Suleyman bestätigt.

Anzeige
Anzeige

Im Juni 2024 erklärt er, warum der Weg zu verlässlichen KI-Agenten noch weit ist: Zwar könnten KI-Modelle in den nächsten zwei Jahren in eng umgrenzten Anwendungsfällen weitgehend autonom agieren. Bis sie aber konstant präzise arbeiten, brauche es seiner Meinung nach noch zwei Modellgenerationen. Die Modelle müssten für jede Anfrage einen exakt passenden Funktionsaufruf darstellen können.

Laut Suleyman reicht die derzeitige Genauigkeit von 80 Prozent für zuverlässige KI-Agenten nicht aus. Für das Vertrauen der Endnutzer sei eine Trefferquote von 99 Prozent erforderlich. Um diese zu erreichen, benötigten die Modelle etwa die hundertfache Rechenleistung - ein Niveau, das erst mit GPT-6 erreicht werden dürfte, schätzt Suleyman.

Dennoch bietet Google mit Gemini 2.0 bereits Ansätze und plant, diese weiter auszubauen. OpenAI soll im Januar mit dem "Operator" starten, einem KI-Agenten, der unter anderem Internet-Browser bedienen kann.

Was ist überhaupt ein KI-Agent?

Wer regelmäßig mit großen Sprachmodellen und komplexeren Prompts in konkreten Praxisprojekten arbeitet, versteht die Zurückhaltung von Kilpatrick und Suleyman. Die Zuverlässigkeit von LLMs ist verbesserungswürdig, insbesondere bei komplexen und detaillierten Anweisungen.

Letztlich sind aber alle pauschalen Prognosen zu Agenten relativ, da es auf die genaue Definition von Agenten ankommt. Eine hilfreiche Definition stammt von Anthropic: Das Unternehmen unterscheidet klar zwischen Workflows und Agenten.

Empfehlung

Während Workflows vordefinierten Codepfaden folgen, bei denen Sprachmodelle und Tools nach festgelegten Mustern zusammenarbeiten, steuern echte Agenten ihre Prozesse und Werkzeuge dynamisch und eigenständig. Die Definition von OpenAI ist ähnlich, die KI-Firma beschreibt agentische Systeme als KI-Systeme, die komplexe Ziele mit begrenzter direkter Überwachung verfolgen können.

Flussdiagramm: Interaktionszyklus zwischen Human, LLM Call und Environment mit Aktions- und Feedback-Loops sowie Stop-Option.
Anthropics Interaktionsmodell autonomer KI-Agenten zeigt den zyklischen Ablauf zwischen Mensch, LLM und Umgebung. Durch kontinuierliches Feedback und definierte Stoppbedingungen bleibt der Prozess kontrollierbar und zielgerichtet. | Bild: Anthropic

Viele Unternehmen, die jetzt schon behaupten, Agenten anzubieten, verknüpfen womöglich nur Prompts untereinander oder mit einem Werkzeug wie einer Datenbank- oder Websuche. Das macht die Anwendung nicht unnütz, aber es ist eben hauptsächlich Marketing. Korrekter wäre es, man würde eher von Prompt-Chaining (verknüpfte Prompts) oder Assistants (im Sinne von vor-geprompteten, mit Datenbank verknüpften Chatbots) sprechen.

Bezeichnend ist, dass ausgerechnet Anthropic, das mit Computer Use einen ersten "Next-Gen"-Agenten für Computeraktionen veröffentlicht hat, bei Agenten zur Zurückhaltung mahnt: Stattdessen sollten Unternehmen mit einfachen Prompts beginnen und diese optimieren.

Mehrstufige Agentensysteme seien erst dann sinnvoll, wenn einfachere Lösungen an ihre Grenzen stoßen. Viele Unternehmen scheitern noch daran, generative KI überhaupt sinnvoll in ihren Arbeitsalltag zu integrieren, weil die Arbeit mit den Systemen so neu und die Verlässlichkeit noch gering ist.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Google-Produktleiter Logan Kilpatrick erwartet, dass KI-Vision-Fähigkeiten 2025 Mainstream werden. KI-Agenten benötigen seiner Meinung nach noch mehr Entwicklungszeit bis 2026.
  • Microsofts "CEO of AI" Mustafa Suleyman sieht ebenfalls Herausforderungen bei der Entwicklung zuverlässiger KI-Agenten. Er schätzt, dass die derzeitige Genauigkeit von 80 Prozent nicht ausreicht und eine Trefferquote von 99 Prozent für das Vertrauen der Nutzer erforderlich ist.
  • Letztlich ist die Definition von KI-Agenten entscheidend für die Bewertung ihrer Einsatzbereitschaft: Anthropic unterscheidet zwischen vordefinierten Workflows und echten Agenten, die ihre Prozesse und Werkzeuge dynamisch und eigenständig steuern. Das Unternehmen rät dazu, mit einfachen Prompts zu beginnen und erst bei Bedarf auf komplexere Agentensysteme umzusteigen.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!