Google führt neue Funktionen zur KI-gestützten Videogenerierung in der Gemini-App und im Experiment Whisk ein. Die Videos basieren auf dem Modell Veo 2 und sind auf acht Sekunden Länge beschränkt.
Google erweitert seine Gemini-App und das generative KI-Tool Whisk um die Möglichkeit, kurze Videos aus Texten und Bildern zu erzeugen. Die zugrundeliegende Technik stammt von Veo 2, einem Videomodell, das laut Google realitätsnahe Bewegungen und visuelle Details erzeugen soll. Die Funktionen stehen ausschließlich Abonnenten des Google-One-AI-Premium-Dienstes zur Verfügung.
In Gemini Advanced lassen sich jetzt Textbeschreibungen direkt in Video-Clips umwandeln. Die Ergebnisse sind auf acht Sekunden Länge und eine Auflösung von 720p im MP4-Format beschränkt. Die Clips erscheinen im 16:9-Querformat und sollen sich laut Google für Kurzformate auf Plattformen wie TikTok oder YouTube Shorts eignen. Für die Nutzung gilt ein monatliches Limit, über das Nutzer informiert werden.
Mögliche Prompts reichen von realistischen Naturaufnahmen bis zu stilisierten oder surrealen Szenen. Google betont, dass detaillierte Eingaben zu besseren Resultaten führen.
Whisk Animate erlaubt mehr Kontrolle
Auch das Google-Labs-Experiment Whisk erhält mit „Whisk Animate“ eine neue Funktion, die hochgeladene Bilder in animierte Clips verwandelt. Dafür wird ebenfalls Veo 2 verwendet. Die Videoausgabe ist auch hier auf acht Sekunden begrenzt und exklusiv für Premium-Abonnenten nutzbar.
Zur Kennzeichnung der KI-generierten Videos nutzt Google die hauseigene SynthID-Technologie, die ein nicht sichtbares Wasserzeichen in jedes Videoframe einbettet. Zusätzlich sollen Inhalte, die gegen Googles Richtlinien verstoßen, durch Red-Teaming und weitere Prüfverfahren verhindert werden.
Die neuen Funktionen werden schrittweise weltweit ausgerollt und sind in allen Sprachen verfügbar, die auch Gemini unterstützt. Reguläre Gemini-Nutzer erhalten keinen Zugang zu den neuen Videooptionen.