Die neue Vorabversion von Googles Sprachmodell Gemini 2.5 Pro soll vor allem bei der Frontend-Entwicklung und der Umsetzung komplexer Programmieraufgaben deutlich besser abschneiden als bisherige Versionen.
Google hat eine aktualisierte Vorabversion seines KI-Sprachmodells Gemini 2.5 Pro veröffentlicht. Die "I/O Edition" richtet sich an Entwicklerinnen und Entwickler, die das Modell vor der anstehenden Entwicklerkonferenz Google I/O testen wollen. Die neue Version soll insbesondere bei grundlegenden Programmieraufgaben und der Erstellung agentenbasierter Workflows Fortschritte bringen.

Nach Angaben von Google ist Gemini 2.5 Pro aktuell das führende Modell auf der WebDev Arena, einem nicht unumstrittenen Benchmark, der die ästhetische und funktionale Qualität von Webanwendungen auf Basis menschlicher Bewertungen misst. Die überarbeitete Version wird unter anderem von den Start-ups Cognition und Replit eingesetzt, um sogenannte Code-Agenten zu entwickeln, die eigenständig Anwendungen generieren können.
Videoanalyse und App-Generierung
Eine weitere Neuerung betrifft die Analyse von Videoinhalten. Gemini 2.5 Pro erreicht 84,8 Prozent im VideoMME-Benchmark und kann daraus Anwendungen generieren. Auch aus Bildern soll das KI-Modell Code-basierte Visualisierungen erstellen können. Ein Beispiel gibt es hier in der Gemini App.
Ein weiteres Beispiel ist die "Video to Learning App", die aus einem einzelnen YouTube-Video eine interaktive Lernplattform erstellt – inklusive Benutzeroberfläche und didaktischer Struktur.
Bei der Implementierung neuer Funktionen in bestehenden Webprojekten kann das Modell unterstützend eingesetzt werden. Üblicherweise analysieren Entwickler dabei Design-Dateien und schreiben den entsprechenden CSS-Code, um visuelle Eigenschaften wie Farben, Abstände oder Schriftarten umzusetzen. Gemini 2.5 Pro ist in der Lage, diesen Prozess teilweise zu automatisieren. In einer Beispielanwendung wurde auf diese Weise ein Video-Player im Stil der Starter-App Gemini 95 ergänzt.
Die Diktier-App zeigt, wie schnell konzeptionelle Ideen in funktionierende Anwendungen überführt werden können. Die Benutzeroberfläche enthält Details wie animierte Mikrofonwellen, responsives Design und subtile Hover-Effekte. Laut Google kombiniert Gemini 2.5 Pro gutes Designverständnis mit der Möglichkeit präziser Steuerung durch Nutzer.
Das neue 2.5-Modell kann über die Gemini-API im Google AI Studio oder über Vertex AI genutzt werden. Bestehende Nutzer der älteren Version (03–25) werden automatisch auf die aktualisierte Version (05–06) weitergeleitet. Laut Google wurde unter anderem die Fehlerquote beim Aufruf von Funktionen reduziert und die Auslösungsrate für Funktionstrigger erhöht. Der Preis bleibt unverändert. Eine aktualisierte Modellkarte ist hier verfügbar.
Gemini Pro 2.5 ist Googles bisher leistungsstärkstes KI-Modell. Es handelt sich um ein multimodales Reasoning-Modell, das Text, Audio, Bilder, Video und Code verarbeiten kann. Es zeigt starke Leistungen bei komplexen Denkaufgaben, etwa in mathematisch-naturwissenschaftlichen Tests wie GPQA und AIME, sowie bei der Programmierung, insbesondere bei der Entwicklung von Web-Apps und Code-Transformation.