Anzeige
Short

Google hat ein Whitepaper zu KI-Agenten veröffentlicht. Darin definiert Google einen KI-Agenten als eine Anwendung, die versucht, ein Ziel zu erreichen, indem sie die Welt beobachtet und mit den ihr zur Verfügung stehenden Werkzeugen auf sie einwirkt. Agenten seien autonom und könnten unabhängig von menschlichen Eingriffen agieren, insbesondere wenn sie mit entsprechenden Zielen oder Vorgaben ausgestattet seien. Das Whitepaper beschreibt die drei wesentlichen Komponenten eines Agenten: das Modell als zentraler Entscheidungsträger, Werkzeuge wie APIs zur Interaktion mit der Außenwelt und die Orchestrierungsschicht für Logik und Planung. Agenten würden die Fähigkeiten von Sprachmodellen enorm erweitern und neue Möglichkeiten für KI-Anwendungen eröffnen.

Anzeige
Anzeige
Short

Auch Alibabas KI-Labor Qwen hat kürzlich ein Framework für KI-Agenten veröffentlicht. Qwen-Agent nutzt die Fähigkeiten der Qwen-Modelle wie Instruction Following, Tool Usage, Planning und Memory. Das Framework bietet Basisbausteine wie LLMs (Language Models) und Tools sowie High-Level-Komponenten wie Agenten. Damit können beispielsweise Agenten erstellt werden, die PDF-Dateien lesen, vorgefertigte und benutzerdefinierte Tools verwenden und Funktionen aufrufen können. Ein konkretes Anwendungsbeispiel ist der auf Qwen-Agent basierende Browser-Assistent BrowserQwen. Qwen-Agent unterstützt sowohl Alibabas eigenen Modelldienst DashScope als auch selbst gehostete Qwen-Modelle. Eine GUI-Schnittstelle ermöglicht zudem die Erstellung interaktiver Web-Demos mit dem Gradio-Framework. Zuletzt veröffentlichte Qwen das Vision-LLM QVQ-72B-Preview sowie mehrere spezialisierte Qwen2.5-Modelle für Sprache, Programmierung und Mathematik. Wie bei allen chinesischen KI-Modellen muss bei polistischen Themen mit Zensur rechnen.

Anzeige
Anzeige
Anzeige
Anzeige
Short

Google vergleicht offenbar die eigenen Gemini-Outputs mit jenen von Anthropics KI-Modell Claude, wie aus internen Unterlagen hervorgeht, die TechCrunch vorliegen. Demnach vergleichen Google-Auftragnehmer die Antworten von Gemini mit denen von Claude anhand von Kriterien wie Wahrheitsgehalt und Ausführlichkeit. Pro Eingabeaufforderung haben sie bis zu 30 Minuten Zeit, um zu bewerten, welches Modell besser abschneidet. Den Auftragnehmern fiel auf, dass Claude Sicherheitsaspekte stärker zu betonen scheint als Gemini. Eine Sprecherin von Google Deepmind bestätigte gegenüber Techcrunch, dass sie Ergebnisse von Modellen vergleichen, aber Gemini nicht mithilfe von Anthropic-Modellen verbessern. Die Praxis, die Leistung des eigenen KI-Modells durch Vergleiche mit Konkurrenzprodukten zu evaluieren, sei in der Branche üblich. Google ist ein Investor von Anthropic.

Google News