Elon Musks KI-Startup xAI hat sein neues Sprachmodell Grok 2 und dessen kleinere Variante Grok 2 Mini vorgestellt.
Erste Tests zeigen, dass die Modelle in Benchmarks mit der Konkurrenz mithalten können. Auch bei der Bildgenerierung scheint es weniger Einschränkungen als bei anderen Anbietern zu geben. Beide Modelle sind ab sofort für Nutzer der 𝕏-Plattform verfügbar.
Auf der LMSYS-Rangliste, einer beliebten Vergleichsplattform für Sprachmodelle, belegt "sus-column-r", einer frühen Version von Grok 2, den dritten Platz in der Gesamtwertung und erreicht damit die gleiche Punktzahl wie GPT-4o. Das Modell glänzt insbesondere in den Bereichen Programmieren (Platz 2), schwierige Prompts (Platz 4) und Mathematik (Platz 2).
In verschiedenen akademischen Benchmarks, die Bereiche wie logisches Denken, Leseverständnis, Mathematik, Naturwissenschaften und Programmieren abdecken, zeigen sowohl Grok 2 als auch Grok 2 Mini laut xAIs Messungen deutliche Verbesserungen gegenüber dem Vorgängermodell Grok 1.5.
Sie erreichen Leistungsniveaus, die mit anderen Spitzenmodellen in Bereichen wie naturwissenschaftlichem Wissen auf Graduiertenniveau (GPQA), Allgemeinwissen (MMLU, MMLU-Pro) und Mathematikwettbewerbsaufgaben (MATH) konkurrieren können.
Grok 2 generiert Bilder mit weniger Einschränkungen
Erste Nutzerberichte deuten darauf hin, dass die Bildgenerierung von Grok 2 weniger Einschränkungen unterliegt als bei anderen Anbietern. So soll das Modell politische Illustrationen und reale Personen darstellen, während ChatGPT das verweigert.
Ein Nutzer kommentiert, dass Grok 2 sich nicht um Urheberrechte schere, was den Umgang mit dem Modell unterhaltsamer mache, solange xAI das Angebot aufrechterhalten kann.
Ein anderer Nutzer vergleicht die Bildgenerierung von Grok 2 mit der von Llama und stellt fest, dass Grok 2 besser abschneide und keine "dummen Schutzmaßnahmen" habe.
Die Generierung von realen Personen, insbesondere aus der Politik, und KI-Propaganda wird im Zusammenhang mit Falschmeldungen und insbesondere im Vorfeld der US-Wahlen kritisch diskutiert. Die meisten bekannten kommerziellen Anbieter anderer Modelle haben sich bisher dafür entschieden, die Generierung solcher Motive so weit wie möglich zu blockieren, um eine Flut von politischen Fake-Motiven zu verhindern.
Kürzlich verschickten eine Reihe US-Senatoren einen offenen Brief an Musk, indem sie ihn wegen KI-generierter Fake News auf X um Auskünfte baten. Musk teilte kürzlich ein Video von US-Vizepräsidentin Kamala Harris mit einer KI-geklonten Fake-Stimme, die unter anderem Joe Biden als "senil" bezeichnete.
xAI plant, in Zusammenarbeit mit Black Forest Labs die Fähigkeiten von Grok auf der X-Plattform mit dem FLUX.1-Modell zu erweitern. Premium- und Premium+-Abonnenten können Grok 2 im Rahmen einer Beta-Phase testen, indem sie die neueste Version der X-App installieren. Entwickler haben Zugriff über eine neue Enterprise-API, die im Laufe des Monats erscheinen soll.
Grok 3 soll Ende des Jahres erscheinen und laut Musk das leistungsstärkste KI-System aller Zeiten werden.