Inhalt
summary Zusammenfassung

Anthropic hat eine aktualisierte Version seines Spitzenmodells Claude Opus veröffentlicht. Version 4.1 erzielt neue Bestwerte beim Programmieren und zeigt leichte Fortschritte in den Bereichen Analyse, Recherche und agentisches Verhalten.

Anzeige

Anthropic hat mit Claude Opus 4.1 eine überarbeitete Version seines leistungsstärksten KI-Modells veröffentlicht. Das Update bringt gezielte Verbesserungen bei Programmieraufgaben, insbesondere beim Refactoring von Code, sowie bei datenintensiven Analyseprozessen und sogenannten agentischen Fähigkeiten – also der Fähigkeit, mehrstufige Aufgaben eigenständig und zielgerichtet zu lösen.

Claude Opus 4.1 steht zahlenden Nutzern von Claude, Claude Code sowie über die API, Amazon Bedrock und Google Cloud Vertex AI zur Verfügung. Die Preise bleiben gegenüber dem Vorgängermodell Opus 4 unverändert. Das Modell kann über die API unter dem Tag "claude-opus-4-1-20250805" aufgerufen werden.

Neue Bestleistung bei realitätsnahem Code-Benchmark

Im praxisnahen Programmierbenchmark SWE-bench Verified erreicht Claude Opus 4.1 eine neue Bestmarke von 74,5 Prozent – rund zwei Prozentpunkte mehr als Opus 4 und rund fünf Prozent besser als OpenAIs o-Serie. Das neue Open-Source-Modell von OpenAI liegt noch weiter hinten. Der Benchmark testet die Fähigkeit von KI-Modellen, reale Fehler in Open-Source-Code zu identifizieren und zu beheben.

Anzeige
Anzeige

Neben der Programmierung zeigt Claude Opus 4.1 auch Fortschritte bei Analyse- und Rechercheaufgaben. Laut Anthropic wurde insbesondere die Fähigkeit zur Detailverfolgung und zur agentischen Suche verbessert.

Benchmarktabelle: Claude Opus 4.1 vs Opus 4, Sonnet 4, OpenAI o3, Gemini 2.5 Pro in diversen KI-Aufgaben.
Claude Opus 4.1 schneidet im Vergleich zu anderen führenden KI-Modellen in Benchmarks wie agentischem Codieren, visuellem Schlussfolgern und Mathematikwettbewerben etwas besser ab. | Bild: Anthropic

Das mittlerweile aufgelöste Coding-Start-up Windsurf meldete, dass Claude Opus 4.1 auf einer internen Benchmark für Junior-Entwickler eine Verbesserung um eine Standardabweichung zeigte – vergleichbar mit dem Leistungssprung vom Modell Sonnet 3.7 zu Sonnet 4.

Vorsprung bei Claude Code – Rückstand bei GPT-5?

Die Veröffentlichung von Claude Opus 4.1 fällt in eine Phase, in der OpenAI kurz vor dem nächsten und lange erwarteten Modell-Update mit GPT-5 steht. Laut The Information soll GPT-5 zwar bei Programmier- und Mathematikaufgaben sowie in agentischen Anwendungen besser werden, der große Schritt wie beim Wechsel von GPT-3 auf GPT-4 soll aber ausbleiben.

Womöglich reicht daher schon ein kleines Update von Anthropic, um nicht (übermäßig) in Rückstand zu geraten. Das Unternehmen empfiehlt allen Nutzern den Wechsel von Opus 4 auf Opus 4.1 und kündigt für die kommenden Wochen weitere „substanzielle” Verbesserungen an. Das könnte eine Kampfansage an GPT-5 sein.

Weitere Informationen stellt Anthropic auf seiner Modellseite, in der Systemkarte, der Preisseite und in der Dokumentation zur Verfügung.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Anthropic hat mit Claude Opus 4.1 eine aktualisierte Version seines Spitzenmodells veröffentlicht, die insbesondere beim Programmieren, bei datenintensiven Analysen und beim eigenständigen Lösen mehrstufiger Aufgaben leichte Fortschritte zeigt.
  • Im praxisnahen SWE-bench Verified Benchmark erreicht Claude Opus 4.1 mit 74,5 Prozent eine neue Bestmarke und übertrifft damit das Vorgängermodell Opus 4 sowie OpenAIs o-Serie.
  • Claude Opus 4.1 steht zahlenden Nutzern ohne Preisaufschlag zur Verfügung. Anthropic empfiehlt den Wechsel auf die neue Version und kündigt weitere Verbesserungen für die kommenden Wochen an.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!