Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Short

Google hat ein Whitepaper zu KI-Agenten veröffentlicht. Darin definiert Google einen KI-Agenten als eine Anwendung, die versucht, ein Ziel zu erreichen, indem sie die Welt beobachtet und mit den ihr zur Verfügung stehenden Werkzeugen auf sie einwirkt. Agenten seien autonom und könnten unabhängig von menschlichen Eingriffen agieren, insbesondere wenn sie mit entsprechenden Zielen oder Vorgaben ausgestattet seien. Das Whitepaper beschreibt die drei wesentlichen Komponenten eines Agenten: das Modell als zentraler Entscheidungsträger, Werkzeuge wie APIs zur Interaktion mit der Außenwelt und die Orchestrierungsschicht für Logik und Planung. Agenten würden die Fähigkeiten von Sprachmodellen enorm erweitern und neue Möglichkeiten für KI-Anwendungen eröffnen.

Short

Auch Alibabas KI-Labor Qwen hat kürzlich ein Framework für KI-Agenten veröffentlicht. Qwen-Agent nutzt die Fähigkeiten der Qwen-Modelle wie Instruction Following, Tool Usage, Planning und Memory. Das Framework bietet Basisbausteine wie LLMs (Language Models) und Tools sowie High-Level-Komponenten wie Agenten. Damit können beispielsweise Agenten erstellt werden, die PDF-Dateien lesen, vorgefertigte und benutzerdefinierte Tools verwenden und Funktionen aufrufen können. Ein konkretes Anwendungsbeispiel ist der auf Qwen-Agent basierende Browser-Assistent BrowserQwen. Qwen-Agent unterstützt sowohl Alibabas eigenen Modelldienst DashScope als auch selbst gehostete Qwen-Modelle. Eine GUI-Schnittstelle ermöglicht zudem die Erstellung interaktiver Web-Demos mit dem Gradio-Framework. Zuletzt veröffentlichte Qwen das Vision-LLM QVQ-72B-Preview sowie mehrere spezialisierte Qwen2.5-Modelle für Sprache, Programmierung und Mathematik. Wie bei allen chinesischen KI-Modellen muss bei polistischen Themen mit Zensur rechnen.

Anzeige
Anzeige
Google News