Inhalt
summary Zusammenfassung

xAIs neues Sprachmodell Grok 4 Fast liefert in Benchmarks ähnliche Ergebnisse wie Grok 4, verbraucht aber deutlich weniger Rechenleistung.

Anzeige

xAI hat eine abgespeckte Version seines bisherigen Spitzenmodells vorgestellt. Grok 4 Fast soll bei typischen Aufgaben ähnlich gut abschneiden wie Grok 4, aber mit rund 40 Prozent weniger Rechenaufwand auskommen. Das senkt laut Anbieter die Kosten pro Aufgabe um bis zu 98 Prozent.

In Benchmarks wie GPQA Diamond (85,7 %) oder AIME 2025 (92,0 %) liegt Grok 4 Fast nahe an GPT-5 oder Grok 4. Gleichzeitig verbraucht es laut xAI deutlich weniger Tokens für den Rechenprozess: Grok 4 Fast benötigt im Schnitt 40 Prozent weniger sogenannte „Thinking Tokens“ als Grok 4, um vergleichbare Ergebnisse zu erzielen. Der Unterschied zeigt sich laut xAI vor allem bei komplexen Aufgaben, wo andere Modelle mehr Zwischenschritte und damit mehr Rechenaufwand benötigen.

Während frühere Versionen unterschiedliche Modelle für einfache Antworten und komplexe Denkprozesse verwendeten, kombiniert Grok 4 Fast beides in einer Architektur. XAI folgt damit dem Trend hin zu hybriden Modellen, das Verhalten wird laut dem Unternehmen über den Systemprompt gesteuert.

Anzeige
Anzeige

Grok 4 Fast wurde zusätzlich darauf trainiert, eigenständig Tools wie Webbrowser oder Code-Ausführung zu nutzen. In Benchmarks wie BrowseComp (44,9 %) oder X Bench Deepsearch (74 %) schneidet es besser ab als Grok 4 und im LMArena-Search-Benchmark liegt es aktuell vor OpenAIs o3-websearch, das bisher dort den Spitzenplatz belegte. In der Text Arena erreicht es Rang 8 und liegt damit laut xAI deutlich vor anderen Modellen ähnlicher Größe.

Einheitliches Modell für verschiedene Aufgaben

Das Modell steht über grok.com, iOS- und Android-Apps sowie über die xAI API zur Verfügung. Angeboten werden zwei Varianten: eine für reasoning-intensive Aufgaben, eine für einfache Antworten, jeweils mit einem 2-Millionen-Token-Kontextfenster. Entwickler zahlen je nach Token-Typ zwischen $0,05 und $1,00 pro Million Tokens. Für kurze Zeit ist Grok 4 Fast auch kostenlos über OpenRouter und Vercel nutzbar.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • xAI hat Grok 4 Fast vorgestellt, eine optimierte Version seines Spitzenmodells, die bei ähnlicher Leistung 40 Prozent weniger Rechenaufwand benötigt und die Kosten pro Aufgabe um bis zu 98 Prozent senkt.
  • In Benchmarks wie GPQA Diamond (85,7 %) und AIME 2025 (92,0 %) erreicht Grok 4 Fast vergleichbare Werte wie GPT-5 oder das ursprüngliche Grok 4, während es deutlich weniger "Thinking Tokens" für komplexe Aufgaben verbraucht.
  • Das Modell kombiniert erstmals einfache Antworten und komplexe Denkprozesse in einer einheitlichen Architektur und kann eigenständig Tools wie Webbrowser nutzen. Es ist über grok.com, Apps und die xAI API verfügbar, wobei Entwickler zwischen $0,05 und $1,00 pro Million Tokens zahlen.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!