Anthropic hat die nächste Generation seiner KI-Modelle veröffentlicht, Claude Opus 4 und Sonnet 4. Zeitgleich kündigt das Unternehmen die Aktivierung von Maßnahmen der KI-Sicherheitsstufe 3 an, die speziell auf die Verhinderung des Missbrauchs für CBRN-Waffen abzielen.
Mit Claude Opus 4 und Claude Sonnet 4 veröffentlicht Anthropic zwei neue Sprachmodelle, die vor allem in der Softwareentwicklung und bei agentenbasierten Anwendungen neue Möglichkeiten eröffnen sollen. Beide Modelle beherrschen längere Denkprozesse, können Tools wie Websuche parallel nutzen und speichern Informationen über Dokumentzugriff in einem erweiterten Gedächtnis.
Claude Opus 4 ist laut Anthropic das leistungsfähigste Modell des Unternehmens und soll besonders bei Code-Aufgaben und komplexen, mehrstündigen Arbeitsabläufen überzeugen. Das Modell führt Benchmarks wie SWE-bench (72,5 %) und Terminal-bench (43,2 %) an und erzielt auch in anderen Tests wie MMMLU (87,4 %) oder GPQA Diamond (74,9 %) Spitzenwerte. Mit "Extended Thinking" steigt die Leistung je nach Aufgabe um einige Prozentpunkte. Der Schwerpunkt liegt auf nachhaltiger Leistung über viele Schritte hinweg. Bei Zugriff auf lokale Dateien kann Opus 4 sogenannte „Memory Files“ anlegen, was etwa beim Navigieren durch komplexe Spielewelten wie Pokémon hilfreich sein soll.
Sonnet 4 als Allround-Modell für Entwickler
Claude Sonnet 4 ist eine verbesserte Version von Sonnet 3.7 und richtet sich an alltägliche, aber anspruchsvolle Anwendungen. Es erreicht 72,7 % auf dem SWE-bench und zeigt laut Partnerunternehmen wie GitHub und Sourcegraph eine deutlich verbesserte Fähigkeit zur Problemlösung, Code-Navigation und Ausführung komplexer Anweisungen. GitHub will Sonnet 4 als Basismodell für den neuen Copilot-Agenten einsetzen.
Beide Modelle reduzieren laut Anthropic die Neigung zu Abkürzungen oder Schlupflöchern bei agentenbasierten Aufgaben um 65 % im Vergleich zu Sonnet 3.7. Für besonders lange Denkprozesse kommen sogenannte „Thinking Summaries“ zum Einsatz, die die Kette von Gedankenschritten verdichten – nötig sei das laut Anthropic aber nur in etwa 5 % der Fälle.
Neues Werkzeugset für Entwickler
Parallel zur Modellveröffentlichung stellt Anthropic neue Funktionen für die eigene API vor, mit denen sich Agenten effizienter bauen lassen. Dazu gehört ein Code-Ausführungswerkzeug, das Python-Code in einer abgeschotteten Umgebung ausführen kann – inklusive Datenanalyse und Visualisierung in einem einzigen Schritt. Darüber hinaus können Agenten über den neuen MCP-Connector mit externen Systemen wie Asana oder Zapier kommunizieren, ohne dass eigene Integrationen notwendig sind.
Die neue Files API erlaubt es, Dokumente einmalig hochzuladen und dann über mehrere Sitzungen hinweg zu referenzieren. In Kombination mit dem Code-Ausführungswerkzeug kann Claude diese Dateien analysieren und Ergebnisse wie Diagramme direkt zurückgeben. Für längere Sitzungen steht ein Prompt-Caching mit bis zu einer Stunde Gültigkeit zur Verfügung – eine Verbesserung um den Faktor 12 gegenüber dem bisherigen 5-Minuten-Cache.
Claude Code jetzt allgemein verfügbar
Das bereits im Vorfeld getestete Claude Code ist nun allgemein verfügbar. Entwickler können es direkt in IDEs wie VS Code oder JetBrains integrieren. Claude schlägt Änderungen direkt in der Datei vor. Der Claude-Code-Agent kann außerdem in GitHub Pull Requests eingebunden werden und dort Feedback umsetzen, CI-Fehler korrigieren oder Code anpassen. Für eigene Agenten steht ein SDK bereit.
Sicherheitsniveau ASL-3 erstmals aktiviert
Mit Claude Opus 4 aktiviert Anthropic erstmals den Sicherheitsstandard AI Safety Level 3 (ASL-3) aus seiner Responsible Scaling Policy. Diese Maßnahme erfolge vorsorglich, da sich das Modell durch Fortschritte im Wissen über chemische, biologische, radiologische und nukleare (CBRN) Risiken auszeichne. Claude Sonnet 4 fällt laut Anthropic nicht unter ASL-3.
ASL-3 umfasst zwei Bereiche: Schutz vor Missbrauch und Schutz vor Diebstahl der Modellgewichte. Um Missbrauch vorzubeugen, setzt Anthropic sogenannte „Constitutional Classifiers“ ein, die Eingaben und Ausgaben in Echtzeit analysieren und gefährliche CBRN-Informationen blockieren sollen. Ein Bug-Bounty-Programm und synthetisches Training mit Jailbreak-Daten sollen das System kontinuierlich stärken.
Zur Sicherung der Modellgewichte vor Diebstahl hat Anthropic zudem über 100 Sicherheitskontrollen implementiert – darunter Zwei-Personen-Autorisierung, Change-Management-Protokolle und Egress-Bandbreitenkontrollen. Letztere sollen verhindern, dass große Datenmengen unbemerkt exportiert werden.
Anthropic betont, dass noch nicht abschließend geklärt sei, ob Claude Opus 4 tatsächlich die Schwelle überschreitet, die ASL-3 zwingend erforderlich macht. Der vorsorgliche Einsatz ermögliche es jedoch, die Schutzmechanismen in der Praxis zu erproben und weiterzuentwickeln.