Anthropic bereitet sich mit Claude Opus 4.1 auf die Ankunft von GPT-5 vor

5. August 2025

Sora prompted by THE DECODER

Kurz & Knapp

Anthropic hat mit Claude Opus 4.1 eine aktualisierte Version seines Spitzenmodells veröffentlicht, die insbesondere beim Programmieren, bei datenintensiven Analysen und beim eigenständigen Lösen mehrstufiger Aufgaben leichte Fortschritte zeigt.
Im praxisnahen SWE-bench Verified Benchmark erreicht Claude Opus 4.1 mit 74,5 Prozent eine neue Bestmarke und übertrifft damit das Vorgängermodell Opus 4 sowie OpenAIs o-Serie.
Claude Opus 4.1 steht zahlenden Nutzern ohne Preisaufschlag zur Verfügung. Anthropic empfiehlt den Wechsel auf die neue Version und kündigt weitere Verbesserungen für die kommenden Wochen an.

Anthropic hat eine aktualisierte Version seines Spitzenmodells Claude Opus veröffentlicht. Version 4.1 erzielt neue Bestwerte beim Programmieren und zeigt leichte Fortschritte in den Bereichen Analyse, Recherche und agentisches Verhalten.

Anthropic hat mit Claude Opus 4.1 eine überarbeitete Version seines leistungsstärksten KI-Modells veröffentlicht. Das Update bringt gezielte Verbesserungen bei Programmieraufgaben, insbesondere beim Refactoring von Code, sowie bei datenintensiven Analyseprozessen und sogenannten agentischen Fähigkeiten – also der Fähigkeit, mehrstufige Aufgaben eigenständig und zielgerichtet zu lösen.

Claude Opus 4.1 steht zahlenden Nutzern von Claude, Claude Code sowie über die API, Amazon Bedrock und Google Cloud Vertex AI zur Verfügung. Die Preise bleiben gegenüber dem Vorgängermodell Opus 4 unverändert. Das Modell kann über die API unter dem Tag "claude-opus-4-1-20250805" aufgerufen werden.

Neue Bestleistung bei realitätsnahem Code-Benchmark

Im praxisnahen Programmierbenchmark SWE-bench Verified erreicht Claude Opus 4.1 eine neue Bestmarke von 74,5 Prozent – rund zwei Prozentpunkte mehr als Opus 4 und rund fünf Prozent besser als OpenAIs o-Serie. Das neue Open-Source-Modell von OpenAI liegt noch weiter hinten. Der Benchmark testet die Fähigkeit von KI-Modellen, reale Fehler in Open-Source-Code zu identifizieren und zu beheben.

Neben der Programmierung zeigt Claude Opus 4.1 auch Fortschritte bei Analyse- und Rechercheaufgaben. Laut Anthropic wurde insbesondere die Fähigkeit zur Detailverfolgung und zur agentischen Suche verbessert.

Benchmarktabelle: Claude Opus 4.1 vs Opus 4, Sonnet 4, OpenAI o3, Gemini 2.5 Pro in diversen KI-Aufgaben. — Claude Opus 4.1 schneidet im Vergleich zu anderen führenden KI-Modellen in Benchmarks wie agentischem Codieren, visuellem Schlussfolgern und Mathematikwettbewerben etwas besser ab. | Bild: Anthropic

Das mittlerweile aufgelöste Coding-Start-up Windsurf meldete, dass Claude Opus 4.1 auf einer internen Benchmark für Junior-Entwickler eine Verbesserung um eine Standardabweichung zeigte – vergleichbar mit dem Leistungssprung vom Modell Sonnet 3.7 zu Sonnet 4.

Vorsprung bei Claude Code – Rückstand bei GPT-5?

Die Veröffentlichung von Claude Opus 4.1 fällt in eine Phase, in der OpenAI kurz vor dem nächsten und lange erwarteten Modell-Update mit GPT-5 steht. Laut The Information soll GPT-5 zwar bei Programmier- und Mathematikaufgaben sowie in agentischen Anwendungen besser werden, der große Schritt wie beim Wechsel von GPT-3 auf GPT-4 soll aber ausbleiben.

Womöglich reicht daher schon ein kleines Update von Anthropic, um nicht (übermäßig) in Rückstand zu geraten. Das Unternehmen empfiehlt allen Nutzern den Wechsel von Opus 4 auf Opus 4.1 und kündigt für die kommenden Wochen weitere „substanzielle” Verbesserungen an. Das könnte eine Kampfansage an GPT-5 sein.

Weitere Informationen stellt Anthropic auf seiner Modellseite, in der Systemkarte, der Preisseite und in der Dokumentation zur Verfügung.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: Anthropic