Inhalt
summary Zusammenfassung

YouTube integriert generative KI in Shorts und Podcasts. Die neuen Funktionen reichen von Text-zu-Video-Generierung mit Veo 3 Fast bis zur automatisierten Erstellung von Podcast-Clips.

Anzeige

Die Version „Veo 3 Fast“ erzeugt laut YouTube Videos mit niedriger Latenz in 480p und kann erstmals auch Ton generieren. Der Rollout startet in den USA, Großbritannien, Kanada, Australien und Neuseeland, weitere Regionen sollen folgen.

Das Modell bringt zusätzliche Fähigkeiten in Shorts: Bewegungen aus Videos lassen sich auf Bilder übertragen, sodass etwa eine Person in einem Foto eine Tanzbewegung nachahmen kann. Außerdem sind neue Stiloptionen wie Pop-Art oder Origami verfügbar. Auch Objekte wie Figuren oder Requisiten können per Texteingabe ergänzt werden. Diese Funktionen sollen in den kommenden Monaten ausgerollt werden.

Ein weiteres Werkzeug ist die Remix-Funktion „Speech to Song“. Damit können Dialoge aus bestehenden Videos automatisch in Songs verwandelt werden. Basis dafür ist Googles KI-Musikmodell Lyria 2. Creator können die Stimmung des Ergebnisses variieren, etwa „chill“ oder „danceable“. Die Funktion startet in Kürze in den USA.

Anzeige
Anzeige

Zusätzlich erprobt YouTube die Funktion „Edit with AI“. Sie verwandelt Rohmaterial aus der Kamera in erste Schnittfassungen, erkennt die „besten Momente“, fügt Musik und Übergänge hinzu und kann ein Voice-over generieren, das in Echtzeit auf das Geschehen reagiert. Die Funktion unterstützt Englisch und Hindi und wird sowohl für Shorts als auch in der YouTube-Create-App getestet.

KI für Podcaster

Parallel kündigte YouTube auf demselben Event neue Tools für Podcaster an. So soll es in den kommenden Monaten in den USA möglich sein, mit KI automatisch vorgeschlagene Clips aus Video-Podcasts zu erzeugen. Diese lassen sich anschließend leicht in Shorts verwandeln.

Für reine Audio-Podcasts will YouTube eine KI-gestützte Videofunktion einführen. Sie generiert automatisch ein anpassbares Video für jede Episode. Der Test startet Anfang 2026 mit einer kleinen Gruppe ausgewählter Podcaster, bevor eine breitere Verfügbarkeit folgt.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • YouTube integriert generative KI in Shorts und Podcasts, darunter die Text-zu-Video-Generierung mit Veo 3 Fast, das Videos mit niedriger Latenz in 480p samt Ton produziert und neue Stiloptionen sowie das Ergänzen von Objekten per Texteingabe ermöglicht; der Rollout startet zunächst in englischsprachigen Ländern.
  • Mit der Remix-Funktion „Speech to Song“ lassen sich Dialoge aus Videos automatisiert in Songs umwandeln, wobei Nutzer die Stimmung wie „chill“ oder „danceable“ wählen können; dieses Tool wird demnächst in den USA verfügbar sein.
  • Für Podcaster testet YouTube automatisierte Clip-Vorschläge aus Video-Podcasts und eine KI-Videofunktion für reine Audio-Podcasts, die ab Anfang 2026 zunächst einer kleinen Gruppe in den USA zur Verfügung stehen soll.
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!