Mit Gemma hat Google erst Anfang des Jahres seine Open-Source-Reihe kleiner bis mittelgroßer Sprachmodelle vorgestellt. Jetzt folgt die neue Version in seiner bisher kleinsten Ausgabe, die im Vergleich dennoch sehr gut abschneidet.
Google hat eine Reihe von Updates für seine KI-Modelle aus der Familie Gemma 2 angekündigt, die den Fokus auf Sicherheit, Transparenz und Zugänglichkeit legen. Zu den Neuerungen gehören ein kompaktes 2-Milliarden-Parameter-Modell, eine Reihe von Sicherheitsklassifizierern sowie ein Werkzeug zur Interpretierbarkeit von Modellen.
Drittes Modell nach 9 und 27 Milliarden Parametern
Das 2-Milliarden-Parameter-Modell (Gemma-2-2B) zeichnet sich laut Google trotz seiner kompakten Größe durch eine hohe Leistung aus und übertrifft einige größere Modelle auf GPT-3.5-Niveau wie Mixtral-8x7B in der Rangliste der LMSYS-Chatbot-Arena. Zuvor hatte Google Gemma 2 in Versionen mit 9 und 27 Milliarden Parametern herausgebracht.
Besonders eindrucksvoll ist die Überlegenheit gegenüber LLaMA-2-70B mit der 35-fachen Parameterzahl. Die reduzierte Parameterzahl ermöglicht den Einsatz auf einer breiten Auswahl auch weniger leistungsfähigen Geräten.
Google Deepmind folgt damit einem allgemeinen LLM-Trend der letzten Monate: Sprachmodelle erreichen derzeit zwar ihre höchste Leistungsfähigkeit auf GPT-4-Niveau und kommen kaum darüber hinaus. Dafür erreichen sie dieses Niveau wesentlich effizienter.
ShieldGemma filtert Hassrede und sexuell explizite Inhalte
Um die Sicherheit beim Einsatz von KI zu gewährleisten, führte Google eine Reihe von Sicherheitsklassifizierern mit 2, 9 und 27 Milliarden Parametern auf Basis von Gemma 2 ein, die schädliche Inhalte in KI-Eingaben und -Ausgaben erkennen und eindämmen sollen. Diese Klassifizierer konzentrieren sich auf die Erkennung von Hassrede, Belästigung, sexuell expliziten und gefährlichen Inhalten.
Gemma Scope soll KI-Entscheidungen transparent machen
Ein weiteres Update ist ein Werkzeug zur Interpretierbarkeit von Modellen namens Gemma Scope, das "wie ein starkes Mikroskop" Einblicke in die Entscheidungsprozesse von Gemma-2-Modellen verspricht. Mithilfe dieses Tools sollen Forschende besser verstehen, wie die Modelle Muster erkennen, Informationen verarbeiten und Vorhersagen treffen.
Gemma-2-2B ist auf verschiedenen Plattformen wie Kaggle, Hugging Face und Vertex AI Model Garden verfügbar und kann in Google AI Studio oder dem kostenlosen Tarif von Google Colab ausprobiert werden. Auch ShieldGemma und Gemma Scope sind frei zugänglich.
Googles KI-Tochter DeepMind hat Gemma im Februar erstmals als Open-Source-Familie seiner großen Sprachmodelle veröffentlicht, im Juli folgte bereits Gemma 2. Kommerziell bietet Google für Endnutzer:innen und Unternehmen seine Gemini-Modelle an.