Claude Sonnet 4 von Anthropic unterstützt jetzt bis zu eine Million Tokens Kontext auf der Anthropic API, Amazon Bedrock und bald auch auf Google Cloud Vertex AI.
Das ist fünfmal mehr als zuvor und ermöglicht laut Anthropic, ganze Codebasen oder viele Forschungsdokumente in einem Schritt zu verarbeiten. Zielgruppen sind Entwickler, die etwa umfangreiche Quellcodes analysieren oder große Dokumentensammlungen zusammenfassen wollen. Die Funktion befindet sich in der öffentlichen Betaphase für Kunden mit Tier-4- oder individuellen API-Limits.

Die Preise steigen mit viel Kontext allerdings deutlich: Für Eingaben über 200.000 Tokens verlangt Anthropic doppelt so viel wie bei kleineren Anfragen – $6 statt $3 pro Million Tokens. Auch die Ausgabe wird teurer: Statt $15 werden hier $22,50 pro Million Tokens fällig. Um Kosten zu senken, empfiehlt Anthropic den Einsatz von „Prompt Caching“ und „Batch Processing“. Letzteres kann laut Anbieter bis zu 50 Prozent Einsparung bringen.