Google Deepmind stellt mit Gemma 3 eine neue Generation seiner offenen KI-Modelle vor, die trotz kompakter Größe Spitzenleistungen erbringen und auf einzelnen GPUs oder TPUs laufen können.
Die Gemma-3-Modelle kommen in vier verschiedenen Größen mit 1, 4, 12 und 27 Milliarden Parametern. Trotz der vergleichsweise kompakten Größe übertrifft das Modell nach Angaben von Google Deepmind in ersten Bewertungen deutlich größere Konkurrenten wie Llama-405B und DeepSeek-V3.
Die Modelle beherrschen laut Google über 140 Sprachen, davon 35 ohne zusätzliches Training. Sie verarbeiten Text, Bilder (ausgenommen 1B) und kurze Videos mit einem Kontextfenster von 128.000 Token. Durch Function Calling und strukturierte Ausgaben sollen sie sich für automatisierte Aufgaben eignen.

Alle Modelle wurden per Destillation trainiert und durchliefen ein spezielles Post-Training mit verschiedenen Reinforcement-Learning-Varianten, das besonders die Fähigkeiten in Mathematik, Chat, Befolgung von Anweisungen und mehrsprachiger Kommunikation verbessern soll.
Gemma wird noch effizienter
Zudem bietet Google erstmals offiziell quantisierte Versionen an, die den Speicherbedarf und die Rechenleistung reduzieren, ohne wesentliche Einbußen bei der Genauigkeit. Gemma 3 soll außerdem signifikant weniger Text wörtlich reproduzieren als frühere Modelle, und es soll nicht zur Reproduktion persönlicher Daten kommen.
Bei menschlichen Bewertungen in der Chatbot-Arena erreicht das Gemma 3-27B-IT-Modell einen Elo-Score von 1338, was es unter die Top 10 der leistungsstärksten KI-Modelle platziert. Besonders bemerkenswert: Das 4B-Modell kann mit dem größeren Gemma 2-27B-IT konkurrieren, während das 27B-Modell laut Google in vielen Benchmarks mit Gemini-1.5-Pro vergleichbar ist.

Parallel zu den multimodalen Gemma-Modellen stellt Google mit ShieldGemma 2 einen spezialisierten Sicherheitsprüfer vor. Dieses 4-Milliarden-Parameter-Modell ist darauf ausgelegt, Bilder auf gefährliche Inhalte, explizites Material und Gewaltdarstellungen zu prüfen.

Die Modelle sind über Hugging Face, Kaggle und Google AI Studio verfügbar. Sie unterstützen gängige Frameworks wie PyTorch, JAX und Keras. Für Akademiker bietet Google Cloud-Credits im Wert von 10.000 Dollar über das Gemma 3 Academic Program. Die Modelle laufen auf NVIDIA GPUs, Google Cloud TPUs und AMD GPUs, für CPUs gibt es Gemma.cpp.