Eine Analyse von Artificial Analysis zeigt die KI-Preissteigerung durch Reasoning-Prozesse am Beispiel von Googles Gemini Flash 2.5. Die Betriebskosten des Modells sind 150-mal höher als bei Gemini Flash 2.0. Grund dafür sind deutlich teurere Ausgabetoken – 3,5 US-Dollar pro Million Token mit Reasoning, im Vergleich zu 0,4 Dollar bei 2.0 – sowie eine 17-fach höhere Token-Nutzung bei den Tests. Gemini 2.5 Flash verbraucht damit so viele Token für logische Schlussfolgerungen wie kein anderes Modell. OpenAIs o4-mini ist pro Token zwar teurer, verbrauchte im Benchmark aber weniger Token, was zu geringeren Gesamtkosten führte.

Anzeige
Balkendiagramm mit dem Titel „Cost to Run Artificial Analysis Intelligence Index“. Es zeigt die Gesamtkosten in US-Dollar, um alle Tests im Artificial Analysis Intelligence Index mit verschiedenen KI-Modellen durchzuführen. Die Balken sind in drei Farben unterteilt: Input (blau), Reasoning (lila), Output (grün).Links stehen die teuersten Modelle:  

GPT-3 ($1951),  

Claude 3 Opus ($1485),  

Gemini 2.5 Pro ($844).

In der Mitte:  

Gemini 2.5 Flash mit Reasoning ($445),  

o4-mini (high) ($323).

Rechts die günstigsten Modelle:  

Gemini 2.0 Flash ($3),  

Llama 3 8B ($2).

Ein lila Pfeil darüber zeigt den Kostenunterschied zwischen Gemini 2.0 Flash und Gemini 2.5 Flash mit Reasoning und hebt „150x“ hervor. Quelle ist „Artificial Analysis“.
Die Betriebskosten für Googles Gemini 2.5 Flash mit aktiviertem Reasoning sind 150-mal höher als bei Gemini 2.0 Flash. | Bild: Artificial Analysis
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!