Inhalt
summary Zusammenfassung

Agent-1 soll schon bald beliebige Software bedienen können. Zunächst startet das KI-Modell als Teil einer Browsererweiterung.  

Matt Shumer, CEO von HyperWriteAI und OthersideAI, hat ein Foundation-Modell namens "Agent-1" angekündigt. Dieses soll in der Lage sein, Software wie ein Mensch zu bedienen. Ein wissenschaftliches Paper fehlt bislang, er hat die Fähigkeiten jedoch in einem Video demonstriert.

Aktuelle KI-Modelle wie GPT-4 sowie selbst die nächste Generation der noch nicht veröffentlichten Modelle seien nicht in der Lage, Software und Programmierschnittstellen zuverlässig zu bedienen, so Shumer.

Kosten und Geschwindigkeit seien bei der Komplexität von Software-Bedienung ebenfalls ein großes Problem. „Agent-1“ soll dieses Problem lösen. Shumer verspricht viel: "Wir sind bereits weit über dem bisherigen Stand der Technik und verbessern uns von Woche zu Woche massiv."

Anzeige
Anzeige

Integration in Chrome-Plugin

Agent-1 soll über die nächsten Aktualisierungen in den Personal Assistant von HyperWrite integriert werden. Dabei handelt es sich um eine Browsererweiterung, die einen KI-Textgenerator unabhängig von der Website zur Verfügung stellt.

Bild: Screenshot/THE DECODER

Ende Juni hatte Shumer bereits eine sehr frühe Version des Personal Assistant vorgestellt, die in der Lage ist, einfache Browser-Aufgaben zu erledigen - etwa eine E-Mail zu verschicken oder Essen zu bestellen.

Agent-1 könnte jedoch deutlich komplexere Aufgaben übernehmen. Im Demovideo von Shumer ist Agent-1 bei der Steuerung eines Google-Cloud-Dashboards zu sehen.

Bild: Screenshot/HyperWrite

"Dynamisches Denken"

"Derzeitige Modelle speichern viel Wissen, so dass weniger Parameter für Schlussfolgerungen übrig bleiben", erklärt er. "Stattdessen wollen wir die gesamte Leistung des Modells für dynamische Schlussfolgerungen einsetzen."

Dieser Ansatz des "dynamischen Denkens" ermögliche es, mit Situationen umzugehen, für die es nicht trainiert wurde. Shumer hat die Latte für Agent-1 ziemlich hochgesteckt:

Empfehlung

Unser Ziel ist es, die menschlichen Fähigkeiten zu übertreffen - ein Assistent, der jede Software bedienen und komplexe Ziele für den Benutzer zuverlässig erreichen kann.

Matt Shumer, CEO von HyperWrite

Wie bei anderen KI-Agenten ist mit Fehlern zu rechnen, aber Shumer verspricht, dass Agent 1 mit der Zeit immer besser wird und dazulernt. Ob Agent 1 hält, was Shumer verspricht, werden die nächsten Wochen zeigen - außer dem kurzen Video gibt es keine weiteren Informationen, die seine Aussagen untermauern könnten.

Was war nochmal mit ACT-1?

Agent-1 erinnert stark an die Demo von ACT-1 von Adept. Das US-Start-up hat seit der Ankündigung im September 2022 abgesehen von einer im März abgeschlossenen Series-B-Finanzierungsrunde mit 350 Millionen US-Dollar nicht mehr viel von sich hören lassen. Zu den Gründer:innen gehören ehemalige Forschende von Deepmind, Meta und Google, einer von ihnen war ein Autor der Transformer-Architektur, die heute Modellen wie GPT-4 zugrunde liegt.

Parallel zu Agent-1 haben auch die Berkeley-Universität und Microsoft Research mit Gorilla ein großes Sprachmodell vorgestellt, das auf 1.600 Programmierschnittstellen trainiert wurde und auf diese Weise in der Lage ist, Software zu bedienen.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Agent-1 ist laut HyperWrite-CEO Matt Shumer ein "bahnbrechendes Foundation-Modell", das schon jetzt Software besser als andere KI-Modelle bedienen könne.
  • Über die nächsten Updates soll es in den Personal Assistant in der Browsererweiterung von HyperWrite integriert werden.
  • Die großen Versprechen und Ziele wurden bislang nur mit einem kurzen Video untermauert.
Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!