Cursors neues Coding-Modell basiert auf Kimi K2.5 - Gründer räumt Fehler ein

21. März 2026

Nano Banana Pro prompted by THE DECODER

Update – 25. März 2026

Ergänzung zur Herkunft des Modells

Update vom 21. März 2026:

Cursors neues KI-Modell basiert auf dem chinesischen Open-Source-Modell Kimi K2.5. Laut Cursor-Mitarbeiter Lee Robinson stammen etwa ein Viertel des Pretrainings vom Basismodell, der Rest vom Weitertraining seitens Cursor. Entsprechend würden auch die Benchmarks anders ausfallen. Die kommerzielle Lizenz wird über den Inferenzpartner Fireworks abgedeckt.

Cursor wird allerdings dafür kritisiert, dies nicht offen kommuniziert zu haben. Die Sache fiel erst auf, als Kimi-Angestellte das Modell näher untersuchten. Cursor-Gründer Aman Sanger räumt einen Fehler ein: "Es war ein Versäumnis, die Kimi-Basis in unserem Blogbeitrag nicht von Anfang an zu erwähnen. Wir werden das beim nächsten Modell korrigieren."

Die eigentliche Frage ist: Warum die Intransparenz? Vermutlich, weil Cursor damit eingestehen würde, im Gegensatz zu Anthropic und OpenAI kein eigenes Frontier-Modell entwickeln zu können. Beide Konkurrenten investieren Milliarden in eigene Basismodelle, Cursor kann auf diesem Niveau schlicht nicht mitspielen.

Das ist per se kein Problem: Ein starkes Open-Source-Modell durch gezieltes Finetuning zu optimieren, ist gängige Praxis und oft der klügere Weg, gerade für ein Unternehmen, dessen Kernkompetenz nicht das Vortrainieren riesiger Sprachmodelle ist, sondern die Entwicklung eines Coding-Editors. Wer aber ein fremdes Basismodell unter eigener Marke verkauft, ohne die Herkunft zu nennen, riskiert genau den Vertrauensverlust, den Cursor jetzt erlebt.

Den Spieß kann man auch umdrehen: Sollte sich herausstellen, dass Cursors Modell mit einem feingetunten Open-Source-Modell konkurrenzfähig zu den Milliarden-Dollar-Eigenentwicklungen von Anthropic und OpenAI ist, wäre das weniger ein Argument gegen Cursor – und mehr eine unbequeme Frage an die Frontier-Labore: Wie viel ist ein proprietäres Basismodell noch wert, wenn ein vergleichsweise kleines Team mit cleverem Finetuning ähnliche Ergebnisse erzielt?

Klüger wäre es seitens Cursor wohl gewesen, die Open-Source-Basis offensiv als Stärke zu kommunizieren: Seht her, wir erreichen mit einem feingetunten Open-Source-Modell vergleichbare Ergebnisse, wozu braucht es dann noch milliardenschwere Eigenentwicklungen? Damit hätte Cursor den Leistungsdruck elegant an OpenAI und Anthropic weitergegeben, statt sich selbst in Erklärungsnot zu bringen.

Ursprünglicher Artikel vom 19. März 2026:

Kampf gegen OpenAI und Anthropic: Cursor bringt neues KI-Modell für Programmierer

Cursor veröffentlicht mit Composer 2 die zweite Generation seines eigenen KI-Modells für Softwareentwicklung. Das Modell soll bei deutlich niedrigeren Kosten mit den führenden Coding-Modellen von Anthropic und OpenAI mithalten.

Das Modell ist ab sofort in Cursor verfügbar, außerdem in der frühen Alpha der neuen Oberfläche "Glass". Der Preis liegt bei 0,50 Dollar pro Million Input-Tokens und 2,50 Dollar pro Million Output-Tokens. Eine schnellere Variante mit laut Cursor identischer Intelligenz kostet 1,50 beziehungsweise 7,50 Dollar pro Million Tokens und ist als Standard voreingestellt.

Modell	Preis pro 1 Mio. Tokens, Input / Output	Hinweis
Composer 2	0,50 / 2,50 Dollar	Standardvariante
Composer 2 Fast	1,50 / 7,50 Dollar	Schnellere Variante mit laut Cursor gleicher Intelligenz
Claude Opus 4.6	5,00 / 25,00 Dollar	API-Preis laut Anthropic, gültig für jede Kontextlänge
GPT-5.4	2,50 / 15,00 Dollar, Short context; 5,00 / 22,50 Dollar, Long context	OpenAI-Preis je nach Kontextlänge

Im reinen API-Preis positioniert Cursor Composer 2 damit deutlich unter Claude Opus 4.6 und auch unter GPT-5.4. Selbst die schnellere Fast-Variante liegt bei den Token-Kosten noch weit unter den Standardpreisen der beiden größeren Wettbewerber.

Gegenüber Bloomberg sagte Co-Gründer Aman Sanger, das Modell sei ausschließlich auf Code-Daten trainiert worden. Dieser Fokus habe es ermöglicht, ein kleineres und kostengünstigeres Modell zu bauen. "Es wird euch nicht bei der Steuererklärung helfen", sagte Sanger. "Es wird keine Gedichte schreiben können."

Reinforcement Learning auf langen Coding-Aufgaben als Trainingsgrundlage

Die Qualitätsverbesserungen gegenüber dem Vorgänger gehen laut Cursor auf den ersten Run für Continued Pretraining zurück, der als stärkere Basis für das anschließende Reinforcement Learning diene. Trainiert werde auf sogenannten Long-Horizon-Coding-Tasks, also Programmieraufgaben, die Hunderte einzelner Aktionen erfordern.

Die von Cursor veröffentlichten Werte zeigen vor allem im Vergleich zu den früheren Composer-Versionen einen deutlichen Sprung. Auf dem hauseigenen CursorBench, also Cursors internem Benchmark für Coding-Aufgaben, steigt Composer 2 von 44.2 bei Composer 1.5 auf 61.3.

Auch bei Terminal Bench 2.0, einem Benchmark für agentische Aufgaben im Terminal, und bei SWE-bench Multilingual, einem Benchmark für Software-Engineering-Aufgaben in mehrsprachigen Umgebungen, legt das Modell klar zu.

Modell	CursorBench	Terminal Bench 2.0	Terminal Bench 2.0 optimiert	SWE bench Multilingual
Composer 2	61.3	61.7		73.7
Composer 1.5	44.2	47.9		65.9
Composer 1	38.0	40.0		56.9
Claude Opus 4.6	58.2	58.0	65.4	77.8
GPT 5.4 Thinking	63.9	75.1		k. A.

Terminal Bench 2.0 ist nur eingeschränkt direkt vergleichbar, da die Ergebnisse auch von Agent, Harness und Einstellungen abhängen. Für Claude Opus 4.6 ist 58.0 der öffentliche Claude-Code-Wert; 65.4 ist ein zusätzlicher, von Anthropic veröffentlichter optimierter Wert. Für GPT-5.4 Thinking ist nur ein einzelner veröffentlichter Terminal-Bench-Wert verfügbar.

Cursor muss sich von seinen Zulieferern emanzipieren

Cursor konkurriert direkt mit Anthropic und OpenAI, die beide zunehmend leistungsfähigere KI-Modelle für die Softwareentwicklung anbieten. Laut Bloomberg hat Cursor inzwischen mehr als eine Million tägliche Nutzer und rund 50.000 Unternehmenskunden. Zudem befinde sich das Unternehmen in Gesprächen über eine neue Finanzierungsrunde bei einer Bewertung von rund 50 Milliarden Dollar.

Gleichzeitig steckt Cursor in einem strukturellen Dilemma. Die Plattform unterstützt weiterhin Modelle von OpenAI und Anthropic und konkurriert damit ausgerechnet mit jenen Anbietern, auf deren Technologie sie bisher angewiesen ist. Solange Cursor externe Modelle einkauft, hängen Preisgestaltung, Leistungsfähigkeit und letztlich auch die eigene Marge von Unternehmen ab, die dieselbe Zielgruppe direkt bedienen.

Gerade Anthropic räumt seinem Coding-Tool Claude Code fast im Alleingang den Coding-Markt ab. Cursor schätzt intern, dass ein Claude-Code-Abo für 200 Dollar im Monat inzwischen Rechenkosten von rund 5.000 Dollar verursachen könnte. Das macht das Problem deutlich: Wer ein fremdes Modell in die eigene Software einbettet, kauft Rechenleistung zu Preisen ein, die der Modellanbieter für sein eigenes Produkt notfalls massiv subventionieren kann.

Für Cursor bleibt in diesem Konstrukt nur wenig Spielraum. Laut dem Bericht laufen die Privatkunden-Abos mit negativen Margen, profitabel seien primär Geschäftskundenverträge. Hinzu kommt, dass immer agentischere Modelle die Bedienoberfläche selbst entwerten könnten, wenn Nutzer solche Systeme zunehmend direkt beim Modellanbieter verwenden.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 16 % Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: “KI Radar” – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren