xAIs neues Sprachmodell Grok 4 Fast liefert in Benchmarks ähnliche Ergebnisse wie Grok 4, verbraucht aber deutlich weniger Rechenleistung.
xAI hat eine abgespeckte Version seines bisherigen Spitzenmodells vorgestellt. Grok 4 Fast soll bei typischen Aufgaben ähnlich gut abschneiden wie Grok 4, aber mit rund 40 Prozent weniger Rechenaufwand auskommen. Das senkt laut Anbieter die Kosten pro Aufgabe um bis zu 98 Prozent.
In Benchmarks wie GPQA Diamond (85,7 %) oder AIME 2025 (92,0 %) liegt Grok 4 Fast nahe an GPT-5 oder Grok 4. Gleichzeitig verbraucht es laut xAI deutlich weniger Tokens für den Rechenprozess: Grok 4 Fast benötigt im Schnitt 40 Prozent weniger sogenannte „Thinking Tokens“ als Grok 4, um vergleichbare Ergebnisse zu erzielen. Der Unterschied zeigt sich laut xAI vor allem bei komplexen Aufgaben, wo andere Modelle mehr Zwischenschritte und damit mehr Rechenaufwand benötigen.
Während frühere Versionen unterschiedliche Modelle für einfache Antworten und komplexe Denkprozesse verwendeten, kombiniert Grok 4 Fast beides in einer Architektur. XAI folgt damit dem Trend hin zu hybriden Modellen, das Verhalten wird laut dem Unternehmen über den Systemprompt gesteuert.
Grok 4 Fast wurde zusätzlich darauf trainiert, eigenständig Tools wie Webbrowser oder Code-Ausführung zu nutzen. In Benchmarks wie BrowseComp (44,9 %) oder X Bench Deepsearch (74 %) schneidet es besser ab als Grok 4 und im LMArena-Search-Benchmark liegt es aktuell vor OpenAIs o3-websearch, das bisher dort den Spitzenplatz belegte. In der Text Arena erreicht es Rang 8 und liegt damit laut xAI deutlich vor anderen Modellen ähnlicher Größe.
Einheitliches Modell für verschiedene Aufgaben
Das Modell steht über grok.com, iOS- und Android-Apps sowie über die xAI API zur Verfügung. Angeboten werden zwei Varianten: eine für reasoning-intensive Aufgaben, eine für einfache Antworten, jeweils mit einem 2-Millionen-Token-Kontextfenster. Entwickler zahlen je nach Token-Typ zwischen $0,05 und $1,00 pro Million Tokens. Für kurze Zeit ist Grok 4 Fast auch kostenlos über OpenRouter und Vercel nutzbar.