YouTube integriert generative KI in Shorts und Podcasts. Die neuen Funktionen reichen von Text-zu-Video-Generierung mit Veo 3 Fast bis zur automatisierten Erstellung von Podcast-Clips.
Die Version „Veo 3 Fast“ erzeugt laut YouTube Videos mit niedriger Latenz in 480p und kann erstmals auch Ton generieren. Der Rollout startet in den USA, Großbritannien, Kanada, Australien und Neuseeland, weitere Regionen sollen folgen.
Das Modell bringt zusätzliche Fähigkeiten in Shorts: Bewegungen aus Videos lassen sich auf Bilder übertragen, sodass etwa eine Person in einem Foto eine Tanzbewegung nachahmen kann. Außerdem sind neue Stiloptionen wie Pop-Art oder Origami verfügbar. Auch Objekte wie Figuren oder Requisiten können per Texteingabe ergänzt werden. Diese Funktionen sollen in den kommenden Monaten ausgerollt werden.
Ein weiteres Werkzeug ist die Remix-Funktion „Speech to Song“. Damit können Dialoge aus bestehenden Videos automatisch in Songs verwandelt werden. Basis dafür ist Googles KI-Musikmodell Lyria 2. Creator können die Stimmung des Ergebnisses variieren, etwa „chill“ oder „danceable“. Die Funktion startet in Kürze in den USA.
Zusätzlich erprobt YouTube die Funktion „Edit with AI“. Sie verwandelt Rohmaterial aus der Kamera in erste Schnittfassungen, erkennt die „besten Momente“, fügt Musik und Übergänge hinzu und kann ein Voice-over generieren, das in Echtzeit auf das Geschehen reagiert. Die Funktion unterstützt Englisch und Hindi und wird sowohl für Shorts als auch in der YouTube-Create-App getestet.
KI für Podcaster
Parallel kündigte YouTube auf demselben Event neue Tools für Podcaster an. So soll es in den kommenden Monaten in den USA möglich sein, mit KI automatisch vorgeschlagene Clips aus Video-Podcasts zu erzeugen. Diese lassen sich anschließend leicht in Shorts verwandeln.
Für reine Audio-Podcasts will YouTube eine KI-gestützte Videofunktion einführen. Sie generiert automatisch ein anpassbares Video für jede Episode. Der Test startet Anfang 2026 mit einer kleinen Gruppe ausgewählter Podcaster, bevor eine breitere Verfügbarkeit folgt.