Update vom 01.04.2025:
Amazon hat weitere Beispiele zu Nova Act veröffentlicht. Das System soll deutlich zuverlässiger arbeiten als bisherige Lösungen. Das System zerlegt nach Angaben von Amazon komplexe Arbeitsabläufe in zuverlässige Einzelbefehle wie Suchen, Bezahlen oder Fragen zum Bildschirminhalt beantworten. Entwickler können zusätzliche Anweisungen einbauen, APIs aufrufen und über die Playwright-Bibliothek direkt mit dem Browser interagieren.
In internen Tests erreichte Nova Act laut Amazon eine Erfolgsquote von mehr als 90 Prozent bei kritischen UI-Interaktionen wie Datumsauswahl oder Pop-up-Handling. Bei etablierten Benchmarks wie ScreenSpot und GroundUI Web schnitt das System besser ab als vergleichbare Modelle von Anthropic und OpenAI.

Nova Act funktioniert laut Amazon offenbar auch in gänzlich unbekannten Umgebungen wie Browserspielen, obwohl es nicht dafür trainiert wurde. Amazon hat das Modell bereits in seinen Sprachassistenten Alexa+ integriert.
Amazon sieht Nova Act als ersten Schritt zu komplexeren KI-Agenten. Statt nur auf überwachtes Feintuning zu setzen, will der Konzern verstärkt auf Reinforcement Learning in verschiedenen Umgebungen setzen. Auch OpenAIs Computer-Using Agent (CUA) wurde per Reinforcement Learning auf Webdaten trainiert.
Amazons langfristiges Ziel sind KI-Agenten, die mehrstufige Aufgaben wie Hochzeitsplanung oder komplexe IT-Aufgaben selbstständig bewältigen können. Aktuell seien solche Anwendungen noch stark von menschlicher Überwachung abhängig. Ein Beispiel zeigt, wie Nova Act in Outlook eine Abwesenheitsnachricht einstellt.
Video: OpenAI
Ursprünglicher Artikel vom 31. März 2025:
Amazon stellt mit "Nova Act" KI-Agenten als Antwort auf OpenAIs Operator vor
Amazon stellt mit Nova Act einen eigenen KI-Agenten vor. US-Kunden und -Entwickler können auf nova.amazon.com eine Vorschauversion des Amazon Nova Act SDK herunterladen. Damit lassen sich Agenten entwickeln, die Aktionen in Webbrowsern ausführen können, ähnlich OpenAIs Operator. Mit dem SDK kann man laut Amazon komplexe Workflows in kleine Befehle wie Suchen, Bezahlen oder Beantworten von Fragen zerlegen. Zudem können detailliertere Anweisungen hinzugefügt werden, um die Zuverlässigkeit zu erhöhen. Nova Act sei ein entscheidender Schritt in Richtung zuverlässiger Agenten, die im Auftrag des Nutzers Aufgaben in digitalen und physischen Umgebungen erledigen können.
Video: via Amazon