Googles neues KI-Videomodell Veo 3 ist seit wenigen Tagen verfügbar und sorgt bereits für virale Effekte. Jetzt wird es international ausgerollt – inklusive Testzugang für Pro-Nutzer.
Etwa 100 Stunden nach dem initialen Launch macht Google sein KI-Videomodell Veo 3 für Nutzer in 71 weiteren Ländern verfügbar. Das kündigte Josh Woodward, Vice President of Gemini bei Google, auf X an. Länder aus der EU stehen noch nicht auf der Liste.
Gemini-Pro-Abonnenten erhalten ein Testpaket mit zehn Veo-3-Generierungen über die Web-Oberfläche. Diese zehn Generierungen sind vorerst ein einmaliges Testpaket. Nutzerinnen mit einem Ultra-Abonnement für 250 US-Dollar im Monat erhalten das maximale Kontingent an Generierungen, das Google zulässt, inklusive täglicher Auffrischung. Im Flow-Modus, der sich besonders an KI-Filmemacher richtet, liegt das monatliche Kontingent für Ultra-Nutzer bei 125 Generierungen. Pro-Abonnenten erhalten dort zehn Generierungen pro Monat.
Google weist auf mehrere bekannte Einschränkungen hin: Veo 3 im Gemini Pro-Plan funktioniert derzeit nur im Web, Mobile- und Workspace-Unterstützung sollen folgen. Offiziell unterstützt das System nur englische Audio-Ausgabe, gelegentlich könnten aber andere Sprachen zu hören sein. Flow unterstützt aktuell keine Sprachausgabe für hochgeladene Bilder.
Präzise Prompts, virale Videos
Nach den NotebookLM Audio Overviews im vergangenen Jahr entwickelt sich Veo 3 zu Googles zweitem KI-Viral-Hit - obwohl der Zugang zum Videomodell noch eingeschränkt ist. In sozialen Medien teilen Nutzer zahlreiche Demo-Videos, die zeigen, wie die Verschmelzung von Audio und Video einen neuen Qualitätsstandard bei KI-generierten Videos schafft. Googles Modell soll Prompts zudem sehr genau befolgen.
Prompt: "The camera follows a dachshund running through a living room and out of an open front door and onto a porch. It stands on the top stair overlooking the neighborhood as an ice cream truck drives by." | Video: Nick Matarese via X
Natürlich ermöglicht Veo 3 so auch die Verbreitung von realistisch wirkenden, aber frei erfundenen Video- und Audioinhalten. Gefälschte Video-Interviews etwa von einer nicht existierenden Automesse wie im Beispiel könnten in vielen anderen Kontexten generiert werden - zum Beispiel von Demonstrationen, die nie stattgefunden haben.
Video: László Gaál via X
Veo 3 bekräftigt Befürchtungen hinsichtlich der Rolle generativer KI bei der Verbreitung von Desinformation und demonstriert eindrucksvoll den Fortschritt generativer KI: Vor wenigen Jahren musste man noch viele Stunden investieren und sehr gute Computer-Kenntnisse haben, um für sogenannte "Deepfakes" mittels KI nur das Gesicht einer Person in einem Video auszutauschen. Heute reicht eine Zeile Text für realistische Szenen mit Bild und Ton. Damit wächst die Anforderung an Mediennutzer, visuelle Inhalte aus unbestätigten Quellen kritischer zu hinterfragen.