Kampf gegen OpenAI und Anthropic: Cursor bringt neues KI-Modell für Programmierer
Kurz & Knapp
- Cursor hat mit Composer 2 ein eigenes KI-Modell für Softwareentwicklung veröffentlicht, das bei den API-Kosten deutlich unter Claude Opus 4.6 und GPT-5.4 liegt: 0,50/2,50 Dollar pro Million Input-/Output-Tokens gegenüber 5,00/25,00 bei Anthropic und 2,50/15,00 bei OpenAI.
- Das ausschließlich auf Code-Daten trainierte Modell erreicht auf Cursors internem CursorBench 61,3 Punkte – ein klarer Sprung gegenüber dem Vorgänger Composer 1.5 (44,2) und nah an Claude Opus 4.6 (58,2) sowie GPT-5.4 Thinking (63,9).
- Ein eigenes Modell ist strategisch wichtig für Cursor: Das Unternehmen konkurriert direkt mit Anthropic und OpenAI, ist aber gleichzeitig auf deren Modelle angewiesen. Daher hat es kaum Spielraum bei den Preisen, während die beiden Modellhersteller günstige Flatrates verkaufen.
Cursor veröffentlicht mit Composer 2 die zweite Generation seines eigenen KI-Modells für Softwareentwicklung. Das Modell soll bei deutlich niedrigeren Kosten mit den führenden Coding-Modellen von Anthropic und OpenAI mithalten.
Das Modell ist ab sofort in Cursor verfügbar, außerdem in der frühen Alpha der neuen Oberfläche "Glass". Der Preis liegt bei 0,50 Dollar pro Million Input-Tokens und 2,50 Dollar pro Million Output-Tokens. Eine schnellere Variante mit laut Cursor identischer Intelligenz kostet 1,50 beziehungsweise 7,50 Dollar pro Million Tokens und ist als Standard voreingestellt.
| Modell | Preis pro 1 Mio. Tokens, Input / Output | Hinweis |
|---|---|---|
| Composer 2 | 0,50 / 2,50 Dollar | Standardvariante |
| Composer 2 Fast | 1,50 / 7,50 Dollar | Schnellere Variante mit laut Cursor gleicher Intelligenz |
| Claude Opus 4.6 | 5,00 / 25,00 Dollar | API-Preis laut Anthropic, gültig für jede Kontextlänge |
| GPT-5.4 | 2,50 / 15,00 Dollar, Short context; 5,00 / 22,50 Dollar, Long context | OpenAI-Preis je nach Kontextlänge |
Im reinen API-Preis positioniert Cursor Composer 2 damit deutlich unter Claude Opus 4.6 und auch unter GPT-5.4. Selbst die schnellere Fast-Variante liegt bei den Token-Kosten noch weit unter den Standardpreisen der beiden größeren Wettbewerber.
Gegenüber Bloomberg sagte Co-Gründer Aman Sanger, das Modell sei ausschließlich auf Code-Daten trainiert worden. Dieser Fokus habe es ermöglicht, ein kleineres und kostengünstigeres Modell zu bauen. "Es wird euch nicht bei der Steuererklärung helfen", sagte Sanger. "Es wird keine Gedichte schreiben können."
Reinforcement Learning auf langen Coding-Aufgaben als Trainingsgrundlage
Die Qualitätsverbesserungen gegenüber dem Vorgänger gehen laut Cursor auf den ersten Run für Continued Pretraining zurück, der als stärkere Basis für das anschließende Reinforcement Learning diene. Trainiert werde auf sogenannten Long-Horizon-Coding-Tasks, also Programmieraufgaben, die Hunderte einzelner Aktionen erfordern.
Die von Cursor veröffentlichten Werte zeigen vor allem im Vergleich zu den früheren Composer-Versionen einen deutlichen Sprung. Auf dem hauseigenen CursorBench, also Cursors internem Benchmark für Coding-Aufgaben, steigt Composer 2 von 44.2 bei Composer 1.5 auf 61.3.
Auch bei Terminal Bench 2.0, einem Benchmark für agentische Aufgaben im Terminal, und bei SWE-bench Multilingual, einem Benchmark für Software-Engineering-Aufgaben in mehrsprachigen Umgebungen, legt das Modell klar zu.
| Modell | CursorBench | Terminal Bench 2.0 | Terminal Bench 2.0 optimiert | SWE bench Multilingual |
|---|---|---|---|---|
| Composer 2 | 61.3 | 61.7 | 73.7 | |
| Composer 1.5 | 44.2 | 47.9 | 65.9 | |
| Composer 1 | 38.0 | 40.0 | 56.9 | |
| Claude Opus 4.6 | 58.2 | 58.0 | 65.4 | 77.8 |
| GPT 5.4 Thinking | 63.9 | 75.1 | k. A. |
Terminal Bench 2.0 ist nur eingeschränkt direkt vergleichbar, da die Ergebnisse auch von Agent, Harness und Einstellungen abhängen. Für Claude Opus 4.6 ist 58.0 der öffentliche Claude-Code-Wert; 65.4 ist ein zusätzlicher, von Anthropic veröffentlichter optimierter Wert. Für GPT-5.4 Thinking ist nur ein einzelner veröffentlichter Terminal-Bench-Wert verfügbar.
Cursor muss sich von seinen Zulieferern emanzipieren
Cursor konkurriert direkt mit Anthropic und OpenAI, die beide zunehmend leistungsfähigere KI-Modelle für die Softwareentwicklung anbieten. Laut Bloomberg hat Cursor inzwischen mehr als eine Million tägliche Nutzer und rund 50.000 Unternehmenskunden. Zudem befinde sich das Unternehmen in Gesprächen über eine neue Finanzierungsrunde bei einer Bewertung von rund 50 Milliarden Dollar.
Gleichzeitig steckt Cursor in einem strukturellen Dilemma. Die Plattform unterstützt weiterhin Modelle von OpenAI und Anthropic und konkurriert damit ausgerechnet mit jenen Anbietern, auf deren Technologie sie bisher angewiesen ist. Solange Cursor externe Modelle einkauft, hängen Preisgestaltung, Leistungsfähigkeit und letztlich auch die eigene Marge von Unternehmen ab, die dieselbe Zielgruppe direkt bedienen.
Gerade Anthropic räumt seinem Coding-Tool Claude Code fast im Alleingang den Coding-Markt ab. Cursor schätzt intern, dass ein Claude-Code-Abo für 200 Dollar im Monat inzwischen Rechenkosten von rund 5.000 Dollar verursachen könnte. Das macht das Problem deutlich: Wer ein fremdes Modell in die eigene Software einbettet, kauft Rechenleistung zu Preisen ein, die der Modellanbieter für sein eigenes Produkt notfalls massiv subventionieren kann.
Für Cursor bleibt in diesem Konstrukt nur wenig Spielraum. Laut dem Bericht laufen die Privatkunden-Abos mit negativen Margen, profitabel seien primär Geschäftskundenverträge. Hinzu kommt, dass immer agentischere Modelle die Bedienoberfläche selbst entwerten könnten, wenn Nutzer solche Systeme zunehmend direkt beim Modellanbieter verwenden.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnieren