Inhalt
summary Zusammenfassung

Google führt neue Funktionen zur KI-gestützten Videogenerierung in der Gemini-App und im Experiment Whisk ein. Die Videos basieren auf dem Modell Veo 2 und sind auf acht Sekunden Länge beschränkt.

Anzeige

Google erweitert seine Gemini-App und das generative KI-Tool Whisk um die Möglichkeit, kurze Videos aus Texten und Bildern zu erzeugen. Die zugrundeliegende Technik stammt von Veo 2, einem Videomodell, das laut Google realitätsnahe Bewegungen und visuelle Details erzeugen soll. Die Funktionen stehen ausschließlich Abonnenten des Google-One-AI-Premium-Dienstes zur Verfügung.

In Gemini Advanced lassen sich jetzt Textbeschreibungen direkt in Video-Clips umwandeln. Die Ergebnisse sind auf acht Sekunden Länge und eine Auflösung von 720p im MP4-Format beschränkt. Die Clips erscheinen im 16:9-Querformat und sollen sich laut Google für Kurzformate auf Plattformen wie TikTok oder YouTube Shorts eignen. Für die Nutzung gilt ein monatliches Limit, über das Nutzer informiert werden.

Mögliche Prompts reichen von realistischen Naturaufnahmen bis zu stilisierten oder surrealen Szenen. Google betont, dass detaillierte Eingaben zu besseren Resultaten führen.

Anzeige
Anzeige

Whisk Animate erlaubt mehr Kontrolle

Auch das Google-Labs-Experiment Whisk erhält mit „Whisk Animate“ eine neue Funktion, die hochgeladene Bilder in animierte Clips verwandelt. Dafür wird ebenfalls Veo 2 verwendet. Die Videoausgabe ist auch hier auf acht Sekunden begrenzt und exklusiv für Premium-Abonnenten nutzbar.

Zur Kennzeichnung der KI-generierten Videos nutzt Google die hauseigene SynthID-Technologie, die ein nicht sichtbares Wasserzeichen in jedes Videoframe einbettet. Zusätzlich sollen Inhalte, die gegen Googles Richtlinien verstoßen, durch Red-Teaming und weitere Prüfverfahren verhindert werden.

Die neuen Funktionen werden schrittweise weltweit ausgerollt und sind in allen Sprachen verfügbar, die auch Gemini unterstützt. Reguläre Gemini-Nutzer erhalten keinen Zugang zu den neuen Videooptionen.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Google ergänzt die Gemini-App und das KI-Experiment Whisk um Videoerstellung aus Texten und Bildern. Grundlage ist das Modell Veo 2, das kurze Clips mit realitätsnahen Bewegungen erzeugen soll. Die Videos sind auf acht Sekunden und 720p-Auflösung limitiert.
  • In Gemini Advanced können zahlende Nutzer Textbeschreibungen direkt in Video-Clips umwandeln. Whisk Animate ermöglicht zusätzlich die Animation von hochgeladenen Bildern. Beide Funktionen sind nur im Google-One-AI-Premium-Abo enthalten.
  • Zur Kennzeichnung nutzt Google die SynthID-Technologie mit unsichtbarem Wasserzeichen. Ein Red-Teaming-Prozess und weitere Prüfungen sollen die Einhaltung von Inhaltsrichtlinien sicherstellen.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!