Inhalt
summary Zusammenfassung

Die neue Vorabversion von Googles Sprachmodell Gemini 2.5 Pro soll vor allem bei der Frontend-Entwicklung und der Umsetzung komplexer Programmieraufgaben deutlich besser abschneiden als bisherige Versionen.

Anzeige

Google hat eine aktualisierte Vorabversion seines KI-Sprachmodells Gemini 2.5 Pro veröffentlicht. Die "I/O Edition" richtet sich an Entwicklerinnen und Entwickler, die das Modell vor der anstehenden Entwicklerkonferenz Google I/O testen wollen. Die neue Version soll insbesondere bei grundlegenden Programmieraufgaben und der Erstellung agentenbasierter Workflows Fortschritte bringen.

Rangliste: Gemini 2.5 Pro-Preview führt WebDev Arena 2025 an, top bei Frontend- und Programmieraufgaben.
WebDev Arena führt Gemini 2.5 Pro-Preview als bestes KI-Modell für anspruchsvolle Frontend- und Programmieraufgaben. | Bild: Google

Nach Angaben von Google ist Gemini 2.5 Pro aktuell das führende Modell auf der WebDev Arena, einem nicht unumstrittenen Benchmark, der die ästhetische und funktionale Qualität von Webanwendungen auf Basis menschlicher Bewertungen misst. Die überarbeitete Version wird unter anderem von den Start-ups Cognition und Replit eingesetzt, um sogenannte Code-Agenten zu entwickeln, die eigenständig Anwendungen generieren können.

Videoanalyse und App-Generierung

Eine weitere Neuerung betrifft die Analyse von Videoinhalten. Gemini 2.5 Pro erreicht 84,8 Prozent im VideoMME-Benchmark und kann daraus Anwendungen generieren. Auch aus Bildern soll das KI-Modell Code-basierte Visualisierungen erstellen können. Ein Beispiel gibt es hier in der Gemini App.

Anzeige
Anzeige

Ein weiteres Beispiel ist die "Video to Learning App", die aus einem einzelnen YouTube-Video eine interaktive Lernplattform erstellt – inklusive Benutzeroberfläche und didaktischer Struktur.

Bei der Implementierung neuer Funktionen in bestehenden Webprojekten kann das Modell unterstützend eingesetzt werden. Üblicherweise analysieren Entwickler dabei Design-Dateien und schreiben den entsprechenden CSS-Code, um visuelle Eigenschaften wie Farben, Abstände oder Schriftarten umzusetzen. Gemini 2.5 Pro ist in der Lage, diesen Prozess teilweise zu automatisieren. In einer Beispielanwendung wurde auf diese Weise ein Video-Player im Stil der Starter-App Gemini 95 ergänzt.

Die Diktier-App zeigt, wie schnell konzeptionelle Ideen in funktionierende Anwendungen überführt werden können. Die Benutzeroberfläche enthält Details wie animierte Mikrofonwellen, responsives Design und subtile Hover-Effekte. Laut Google kombiniert Gemini 2.5 Pro gutes Designverständnis mit der Möglichkeit präziser Steuerung durch Nutzer.

Das neue 2.5-Modell kann über die Gemini-API im Google AI Studio oder über Vertex AI genutzt werden. Bestehende Nutzer der älteren Version (03–25) werden automatisch auf die aktualisierte Version (05–06) weitergeleitet. Laut Google wurde unter anderem die Fehlerquote beim Aufruf von Funktionen reduziert und die Auslösungsrate für Funktionstrigger erhöht. Der Preis bleibt unverändert. Eine aktualisierte Modellkarte ist hier verfügbar.

Gemini Pro 2.5 ist Googles bisher leistungsstärkstes KI-Modell. Es handelt sich um ein multimodales Reasoning-Modell, das Text, Audio, Bilder, Video und Code verarbeiten kann. Es zeigt starke Leistungen bei komplexen Denkaufgaben, etwa in mathematisch-naturwissenschaftlichen Tests wie GPQA und AIME, sowie bei der Programmierung, insbesondere bei der Entwicklung von Web-Apps und Code-Transformation.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Google hat eine aktualisierte Vorabversion seines Sprachmodells Gemini 2.5 Pro für Entwickler bereitgestellt, die besonders bei Frontend-Entwicklung und der Umsetzung komplexer Programmieraufgaben Fortschritte erzielt.
  • Das Modell demonstriert laut Google Spitzenleistungen im WebDev Arena Benchmark, kann Videoinhalte analysieren, um daraus Anwendungen zu erstellen, und die Integration neuer Funktionen in Webprojekte automatisieren.
  • Gemini 2.5 Pro ist über die Gemini-API verfügbar, verarbeitet diverse Datenformate wie Text, Audio, Video und Code und zeigt Stärken bei komplexen Denkaufgaben sowie der Programmierung.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!