Inhalt
summary Zusammenfassung

Google aktualisiert das derzeit wohl fortschrittlichste Videomodell auf Version 3.1. Es soll höhere Bild- und Audioqualität sowie neue Funktionen bieten.

Anzeige

Grundlage ist das neue Videomodell Veo 3.1, das laut Google DeepMind eine höhere Prompt-Treue, realistischere Texturen und verbesserte audiovisuelle Qualität bietet. Es löst das bisherige Veo-3-Modell in Googles Video-KI-Plattform Flow ab. Seit dem Start vor fünf Monaten wurden laut Google mehr als 275 Millionen Clips über die Plattform produziert.

Neue Generierungs- und Bearbeitungsfunktionen

Erstmals unterstützt Flow generierten Ton in drei zentralen Funktionen: Bei "Zutaten zu Video" lassen sich mehrere Referenzbilder hochladen, aus denen Flow eine Szene mit definierten Figuren, Objekten und Stil erstellt.

"Bilder zu Video" erzeugt eine nahtlose Übergangssequenz zwischen zwei vorgegebenen Bildern, etwa für filmische Schnitte. Durch die Vorgabe eines Start- und Endpunkts lässt sich die Generierung besser kontrollieren.

Anzeige
Anzeige

Mit "Erweitern" können bestehende Clips dann verlängert werden – die KI setzt dabei die Handlung ab der letzten Sekunde des vorherigen Clips fort.

In allen drei Fällen generiert Veo 3.1 passende Audiospuren, die laut Google aber noch im experimentellen Stadium sind und auf Nutzerfeedback weiterentwickelt werden sollen.

Neben der Audiointegration führt Flow neue Bearbeitungsfunktionen ein. Mit "Insert" lassen sich beliebige Elemente in eine Szene einfügen, von realistischen Details bis zu Fantasiewesen. Flow passt dabei automatisch Lichtverhältnisse und Schatten an, um die Ergänzungen nahtlos in die Umgebung einzufügen. Die Funktion "Remove", die bald verfügbar sein soll, erlaubt das Entfernen unerwünschter Objekte oder Figuren. Die KI rekonstruiert den Hintergrund so, als sei das entfernte Element nie vorhanden gewesen.

Veo 3.1 ist neben Flow auch über die Gemini-API nutzbar, für Unternehmen über Vertex AI, und Endnutzer können es in der Gemini-App testen. Eine Demo-App für Veo-Videofunktionen ist hier verfügbar, benötigt aber einen API-Schlüssel.

Zugang und Nutzung sind an ein gestaffeltes Abo-System gekoppelt: Im kostenlosen Tarif stehen monatlich 100 AI-Credits zur Verfügung, im kostenpflichtigen "Google AI Pro"-Plan 1.000 Credits, und im "Google AI Ultra"-Paket 25.000 Credits sowie der volle Zugriff auf Veo 3 inklusive der schnellsten Implementierung "Veo 3 Fast".

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Google integriert erstmals generierten Ton in sein KI-Videotool Flow, das jetzt auf dem neuen Modell Veo 3.1 basiert.
  • Dieses Modell soll laut Google DeepMind eine höhere Prompt-Treue, realistischere Texturen und eine verbesserte audiovisuelle Qualität bieten.
  • Flow unterstützt nun drei zentrale Funktionen mit Audiogenerierung: "Zutaten zu Video" erstellt Szenen aus mehreren Referenzbildern, "Bilder zu Video" erzeugt nahtlose Übergänge zwischen Bildern, und mit "Erweitern" lassen sich bestehende Clips fortsetzen.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!