Inhalt
summary Zusammenfassung

Elon Musks KI-Unternehmen xAI hat sein neues Sprachmodell Grok 3 vorgestellt. Erste Tests zeigen Stärken bei komplexen Aufgaben, aber auch deutliche Schwächen. Die Nutzung wird deutlich teurer.

Anzeige

xAI hat am Montag sein neues KI-Flaggschiff Grok 3 veröffentlicht. Laut Elon Musk wurde das Modell mit zehnmal mehr Rechenleistung als sein Vorgänger entwickelt. Dafür nutzte das Unternehmen ein Rechenzentrum in Memphis mit rund 200.000 GPUs.

Die Grok-3-Familie umfasst mehrere Modellvarianten, darunter eine schnellere, aber weniger genaue Mini-Version. Neu sind die "Reasoning"-Modelle, die sich besonders für mathematisch-naturwissenschaftliche Fragestellungen eignen sollen und die in der Grok-Oberfläche über "Thinking" und "Big Brain" in verschiedenen Stufen ein- und ausgeschaltet werden können. Die nun veröffentlichte Version von Grok 3 soll noch nicht final sein, laut xAI befindet sich das Modell noch im Training und das Team kündigte im Livestream stetige Verbesserungen des Modells in den kommenden Wochen an.

Grok 3: Starke Benchmarks und Lob von OpenAI-Gründer

Laut der KI-Benchmarking-Plattform lmarena.ai ist Grok 3 das erste Modell, das in der Chatbot-Arena eine Punktzahl von über 1400 erreicht hat. Es führt in allen Kategorien, einschließlich Programmierung, und übertrifft die besten Modelle von OpenAI, Anthropic und Google. Wie stark er in der Praxis ist, wird sich in den nächsten Tagen zeigen. Denn auch wenn die Chatbot-Arena deutlich aussagekräftiger ist als einzelne Benchmarks, kann die Nutzererfahrung dennoch variieren. So wurde beispielsweise Claude 3.5 Sonnet im Coden bereits übertroffen, gilt aber in der Community weiterhin als bestes Modell für diese Aufgabe.

Anzeige
Anzeige

Eine erste Einschätzung jenseits der Benchmarks kommt vom KI-Experten und OpenAI-Gründer Andrej Karpathy, der frühzeitig Zugang zu Grok 3 erhielt. Er bescheinigt dem Modell beeindruckende Fähigkeiten im logischen Denken. Die "Think"-Funktion löse zuverlässig komplexe Aufgaben wie die Berechnung von Trainings-Flops für GPT-2 oder die Erstellung von Hexagon-Gittern für Brettspiele - eine Fähigkeit, die laut Karpathy bisher nur OpenAIs teuerstem Modell o1-pro vorbehalten war.

Auch bei einfachen mathematischen Aufgaben wie dem Zählen von Buchstaben oder dem Vergleich von Dezimalzahlen zeige sich die Stärke der "Think"-Funktion: Während das Basismodell hier noch Fehler mache, liefere es mit aktiviertem Denkmodus korrekte Ergebnisse.

Neue Suchfunktion mit Kinderkrankheiten

Die neue DeepSearch-Funktion, die das Internet und X nach Informationen durchsucht, erreicht laut Karpathy etwa das Niveau von Perplexitys Recherche-Tool. Sie liefere brauchbare Antworten auf aktuelle Fragen wie "Was ist mit dem bevorstehenden Apple-Launch?" oder "Warum steigt die Palantir-Aktie?".

Allerdings entdeckte der KI-Experte auch ernste Mängel: Das Modell generiere teilweise nicht existierende URLs, mache unbelegte Tatsachenbehauptungen und zitiere X-Posts nur auf explizite Nachfrage. Auch scheine es blind für die eigene Existenz zu sein - bei einer Auflistung wichtiger KI-Labore habe es xAI selbst ausgelassen.

Empfehlung

DeepSearch erreiche daher noch nicht die Qualität von OpenAIs "Deep Research". Es zeige zudem Schwächen beim Humor und ethischen Fragestellungen.

Höhere Preise für neue Funktionen

Mit der Veröffentlichung des neuen Modells wird Grok auch deutlich teurer: X verdoppelt den Preis für sein Premium+-Abonnement auf 50 Dollar pro Monat. Zusätzlich führt xAI ein separates SuperGrok-Abo für 30 Dollar monatlich ein, das erweiterte Funktionen wie unbegrenzte Bildgenerierung und höhere Limits für Reasoning freischaltet. Grok wird zudem auch außerhalb von X in einer Web-Version unter www.grok.com veröffentlicht. In UK und EU ist die Website bisher nicht verfügbar.

In den kommenden Wochen plant xAI die Einführung eines Voice Mode sowie einer Enterprise API. Außerdem soll der Vorgänger Grok 2 als Open-Source-Modell veröffentlicht werden, sobald Grok 3 stabil läuft.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Elon Musks KI-Unternehmen xAI hat sein neues Sprachmodell Grok 3 vorgestellt, das in mehreren Varianten verfügbar ist und sich durch spezielle "Reasoning"-Modelle für mathematisch-naturwissenschaftliche Fragestellungen auszeichnen soll.
  • In ersten Tests erreicht Grok 3 Bestwerte auf der Benchmarking-Plattform lmarena.ai und überzeugt mit starken Fähigkeiten im logischen Denken, zeigt aber auch Schwächen bei der neuen Suchfunktion DeepSearch, die teilweise fehlerhafte Ergebnisse liefert.
  • Mit der Veröffentlichung von Grok 3 erhöht xAI die Preise deutlich: Das Premium+-Abo auf X kostet nun 50 Dollar pro Monat, zusätzlich gibt es ein SuperGrok-Abo für 30 Dollar monatlich. Der Dienst startet zunächst nur in den USA, weitere Funktionen wie ein Voice Mode sind in Planung.
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!