- Technische Details zum Agenten-System ergänzt
Update vom 10. März 2025:
Der Nutzer "Jian" bei X hat herausgefunden, dass Manus wohl auf Claude Sonnet mit Zugriff auf 29 Tools und die Open-Source-Software Browser Use setzt. Dazu forderte er von Manus AI einfach den Sandbox-Runtime-Code an. Eine Übersicht über die verwendeten Tools und Prompts gibt es hier.
Manus-Chefforscher Yichao "Peak" Ji bestätigte daraufhin die grundlegende Architektur des Systems und erläuterte weitere Details zur technischen Implementierung. Der in der Sandbox verwendete Code sei nur leicht verschleiert und diene ausschließlich dazu, Befehle von den KI-Agenten zu empfangen. Das Design der Tools folge dabei gängigen akademischen Ansätzen.
Eine Besonderheit von Manus AI sei das Multi-Agent-System. Bei der Kommunikation mit der Plattform interagieren die Benutzer ausschließlich mit einem ausführenden Agent (Exectuor Agent). Dieser Agent hat selbst keinen Einblick in die Details des Knowledge Agents, des Planner Agents oder anderer Komponenten.
Laut Ji hilft diese Architektur bei der Kontrolle der Kontextlänge. Sie erklärt auch, warum die durch Jailbreaking gewonnenen Prompts meist Halluzinationen sind, da der ausführende Agent keinen direkten Zugriff auf das Wissen der anderen Agenten hat.
Im Ankündigungsvideo (siehe unten) hieß es, Manus KI werde von "mehreren verschiedenen Modellen" angetrieben. Laut Ji handelt es sich dabei noch um Claude 3.5 Sonnet v1 und verschiedene Feinabstimmungen von Qwen-Modellen. Sonnet 3.7 werde derzeit getestet und sei vielversprechend.
Ansonsten verwende der Agent viele Open-Source-Technologien und würde ohne Open Source nicht existieren, so Ji. Manus AI plant, "in naher Zukunft einige gute Dinge" als Open Source zu veröffentlichen.
Ursprünglicher Artikel vom 9. März 2025:
KI-Agent Manus soll der nächste "Deepseek-Moment" für westliche Chatbots werden
Das chinesische KI-Start-up Monica hat einen vielversprechenden KI-Agenten namens Manus vorgestellt, der komplexe Aufgaben wie Reiseplanung und Finanzanalyse selbstständig ausführen können soll. Das Tool ist jedoch nur auf Einladung verfügbar und viele Details sind noch unklar.
Eine Galerie auf der Manus-Website veranschaulicht Schritt für Schritt, wie der Agent reale Aufgaben ausführen und dabei Ergebnisse wie einen maßgeschneiderten Reiseplan oder umfangreiche Dashboards liefern soll. So organisiert Manus Interview-Termine, entwickelt interaktive Unterrichtsinhalte für Lehrer:innen, vergleicht Versicherungspolicen oder unterstützt bei der Suche nach geeigneten B2B-Lieferanten.
Ausgangspunkt ist immer ein Text-Prompt, der die Aufgabe beschreibt. So hat Manus etwa eine Webseite mit einem interaktiven Dashboard zur Analyse der Tesla-Aktie generiert und stellt sie direkt unter einer öffentlich zugänglichen URL zur Verfügung.

Der Mitgründer und Chefwissenschaftler von Monica, Yichao "Peak" Ji, stellt in einem Video die Idee hinter Manus vor. Bei Manus handele es sich um den ersten allgemeinen KI-Agenten, der über die Fähigkeiten bisheriger Chatbots und Workflow-Systeme hinausgeht, indem er die Lücke zwischen der reinen Ideengenerierung und deren praktischer Umsetzung schließt.
Der Name geht zurück auf das lateinische Sprichwort "Mens et Manus" ("Geist und Hand") und soll verdeutlichen, dass angewandtes Wissen im Vordergrund steht. Auch andere Agentensysteme wie OpenAI Operator verfolgen diesen Gedanken.
Monica behauptet, die ebenfalls agentische Deep-Research-Funktion von OpenAI zu übertreffen, und stützt sich dabei auf den GAIA-Benchmark, einen unabhängigen Benchmark, der die Fähigkeiten von KI-Agenten anhand realer Aufgaben testet. Das Unternehmen selbst gibt jedoch bisher kaum Informationen über sein Team, seine Struktur oder die zugrundeliegenden Modelle preis.

Aus den bisherigen Tests geht hervor, dass Manus einen Standard- und einen Hochleistungsmodus anbietet, was darauf schließen lässt, dass das System wahrscheinlich, wie OpenAI Operator, von einem Reasoning-Modell betrieben wird, das mit mehr Rechenzeit bessere Ergebnisse erzielen kann.
Viele weitere Beispiele gibt es bei X, so soll Manus etwa auf Basis eines Prompts einen Podcast schneiden können. Die Resonanz ist insgesamt sehr positiv bis euphorisch. Teilweise wird von einem neuen Deepseek-Moment gesprochen, in dem Sinne, dass ein chinesisches Start-up unerwartet mit den besten Angeboten westlicher KI-Labore, in diesem Fall OpenAI Deep Research, mithalten kann.
Das Tool ist derzeit nur auf Einladung in einer Web-Preview zugänglich. Da Manus der Open-Source-Gemeinschaft viel zu verdanken habe, wolle man im Laufe des Jahres Teile des Agentensystems ebenfalls als Open Source zur Verfügung stellen.
Entwicklerteam mit KI-App-Erfahrung
2022 gründete Xiao Hong laut Medienberichten das Unternehmen Monica, aus dem später Manus hervorging. Monica fokussierte sich zunächst auf internationale Märkte mit einer KI-Assistenten-Browser-Erweiterung, die mehrere große Sprachmodelle integrierte.
Das Start-up sicherte sich Finanzierungen von ZhenFund und Tencent. Mitbegründer Ji Yichao, zuvor Gründer von Peak Labs und Entwickler der Suchmaschine Magi, brachte zusätzliches technisches Know-how ein.
Der Gründer, auch bekannt als "Red", studierte Softwaretechnik an der renommierten Huazhong University of Science and Technology (HUST). Zuvor gründete er Nightingale Technology, wo er die KI-Assistenten "Yi Ban Assistant" und "Wei Ban Assistant" für Unternehmensanwender entwickelte, die über zwei Millionen Nutzer:innen erreichten.
Manus sah den Hype nicht kommen
Kurz nach der Vorstellung von Manus kamen aufgrund des stark eingeschränkten Launches Zweifel an den Fähigkeiten des Agentensystems auf. Ein Mitarbeiter entschuldigte sich für diese Einschränkung laut der South China Morning Post in einem Social-Media-Beitrag und gab zu, das Interesse unterschätzt zu haben.
Die Server-Ressourcen seien zunächst nur für eine Demoversion ausgelegt gewesen. Die aktuelle Version von Manus stecke noch in den Kinderschuhen und sei weit von dem entfernt, was man letztlich als Produkt anbieten wolle, so Zhang Tao, Produktpartner von Manus AI.
Manus sieht sich zudem mit Fragen nach der Originalität seiner Technologie konfrontiert, da das Produkt wahrscheinlich auf bestehenden großen Sprachmodellen (LLMs) basiert, über die das Team keine Details preisgegeben hat. Deepseek wird ebenfalls vorgeworfen, auf Daten trainiert zu haben, die mit OpenAI-Modellen erzeugt wurden.
Das Agenten-Wettrennen ist in vollem Gange
Auch andere KI-Labore arbeiten an eigenen Agenten. OpenAI hat neben Operator etwa ein Multi-Agenten-Framework namens "Swarm" entwickelt. Für den Operator versprach OpenAI ähnlich zu Manus die autonome Übernahme einer Vielzahl von Aufgaben. Das System stellte sich bei manchen Tests jedoch nicht besonders überzeugend an.
Google arbeitet ebenfalls an Agenten, die über Planungs- und Denkfähigkeiten sowie verschiedene Arten von Gedächtnis verfügen sollen; ein erster Test läuft mit dem Browser-Agenten Mariner. Sowohl der CEO von Google DeepMind, Demis Hassabis, als auch der CEO von Nvidia, Jensen Huang, rechnen in ein bis zwei Jahren mit ersten einsatzfähigen agentenähnlichen Systemen.
Wer Manus und ähnliche Systeme testet, sollte mit seinen Web-Zugangsdaten vorsichtig sein: Umfassende Untersuchungen haben gezeigt, dass sich agentische Systeme leicht in die Irre führen lassen, was besonders dann zu ernsthaften Sicherheitsrisiken führen kann, wenn die KI Zugriff auf die Accounts der Nutzer:innen hat und in deren Namen handelt.