Google verbessert sein KI-Modell Gemini Pro 2.5 fürs Coding

Die neue Vorabversion von Googles Sprachmodell Gemini 2.5 Pro soll vor allem bei der Frontend-Entwicklung und der Umsetzung komplexer Programmieraufgaben deutlich besser abschneiden als bisherige Versionen.

Google hat eine aktualisierte Vorabversion seines KI-Sprachmodells Gemini 2.5 Pro veröffentlicht. Die "I/O Edition" richtet sich an Entwicklerinnen und Entwickler, die das Modell vor der anstehenden Entwicklerkonferenz Google I/O testen wollen. Die neue Version soll insbesondere bei grundlegenden Programmieraufgaben und der Erstellung agentenbasierter Workflows Fortschritte bringen.

Rangliste: Gemini 2.5 Pro-Preview führt WebDev Arena 2025 an, top bei Frontend- und Programmieraufgaben. — WebDev Arena führt Gemini 2.5 Pro-Preview als bestes KI-Modell für anspruchsvolle Frontend- und Programmieraufgaben. | Bild: Google

Nach Angaben von Google ist Gemini 2.5 Pro aktuell das führende Modell auf der WebDev Arena, einem nicht unumstrittenen Benchmark, der die ästhetische und funktionale Qualität von Webanwendungen auf Basis menschlicher Bewertungen misst. Die überarbeitete Version wird unter anderem von den Start-ups Cognition und Replit eingesetzt, um sogenannte Code-Agenten zu entwickeln, die eigenständig Anwendungen generieren können.

Videoanalyse und App-Generierung

Eine weitere Neuerung betrifft die Analyse von Videoinhalten. Gemini 2.5 Pro erreicht 84,8 Prozent im VideoMME-Benchmark und kann daraus Anwendungen generieren. Auch aus Bildern soll das KI-Modell Code-basierte Visualisierungen erstellen können. Ein Beispiel gibt es hier in der Gemini App.

Ein weiteres Beispiel ist die "Video to Learning App", die aus einem einzelnen YouTube-Video eine interaktive Lernplattform erstellt – inklusive Benutzeroberfläche und didaktischer Struktur.

Bei der Implementierung neuer Funktionen in bestehenden Webprojekten kann das Modell unterstützend eingesetzt werden. Üblicherweise analysieren Entwickler dabei Design-Dateien und schreiben den entsprechenden CSS-Code, um visuelle Eigenschaften wie Farben, Abstände oder Schriftarten umzusetzen. Gemini 2.5 Pro ist in der Lage, diesen Prozess teilweise zu automatisieren. In einer Beispielanwendung wurde auf diese Weise ein Video-Player im Stil der Starter-App Gemini 95 ergänzt.

Die Diktier-App zeigt, wie schnell konzeptionelle Ideen in funktionierende Anwendungen überführt werden können. Die Benutzeroberfläche enthält Details wie animierte Mikrofonwellen, responsives Design und subtile Hover-Effekte. Laut Google kombiniert Gemini 2.5 Pro gutes Designverständnis mit der Möglichkeit präziser Steuerung durch Nutzer.

Das neue 2.5-Modell kann über die Gemini-API im Google AI Studio oder über Vertex AI genutzt werden. Bestehende Nutzer der älteren Version (03–25) werden automatisch auf die aktualisierte Version (05–06) weitergeleitet. Laut Google wurde unter anderem die Fehlerquote beim Aufruf von Funktionen reduziert und die Auslösungsrate für Funktionstrigger erhöht. Der Preis bleibt unverändert. Eine aktualisierte Modellkarte ist hier verfügbar.

Gemini Pro 2.5 ist Googles bisher leistungsstärkstes KI-Modell. Es handelt sich um ein multimodales Reasoning-Modell, das Text, Audio, Bilder, Video und Code verarbeiten kann. Es zeigt starke Leistungen bei komplexen Denkaufgaben, etwa in mathematisch-naturwissenschaftlichen Tests wie GPQA und AIME, sowie bei der Programmierung, insbesondere bei der Entwicklung von Web-Apps und Code-Transformation.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Empfehlung

KI in der Praxis

Google verbessert sein KI-Modell Gemini Pro 2.5 fürs Coding

Videoanalyse und App-Generierung

Tesla zeigt Cybercab-Robotaxi, aber Roboter Optimus ist das größere Geschäft

Google bringt Gemini 2.5 Pro und Deep Search in den AI Mode

Google stellt neues Gemini-2.5-Modell vor und erweitert Zugang

Googles Gemini 2.5 Pro schlägt OpenAI o3 beim Verständnis langer Texte

OpenAI startet GPT-5 – mit besserem Verständnis, Personalisierung und Entwickler-Tools

Google Deepmind zeigt mit Genie 3 ein KI-Modell für interaktive Welten in Echtzeit

Google schaltet Gemini 2.5 Deep Think frei – und zieht erste Sicherheitsgrenzen

Google verbessert sein KI-Modell Gemini Pro 2.5 fürs Coding

Videoanalyse und App-Generierung

Artikel teilen

Bankverbindung