DreaMoving: Alibaba zeigt TikTok Generator

Alibaba zeigt einen neuen TikTok-Generator: DreaMoving kann personalisierte Tanzvideos per Bild- oder Textprompt erstellen.

Das System basiert auf Diffusionsmodellen und nutzt unter anderem Video ControlNet und einen Content Guider. Das Video ControlNet steuert die Generierung entlang der vorgegebenen Animation. Der Content Guider ist für die Steuerung des Inhalts der generierten Videos verantwortlich, einschließlich des Aussehens von Personen und Hintergründen.

DreaMoving integriert zusätzlich sogenannte Bewegungsblöcke sowohl in das Denoising U-Net als auch in das ControlNet, um die zeitliche Konsistenz und Bewegungstreue zu verbessern. Benutzer können Text- oder Bildhinweise verwenden, um das gewünschte Aussehen und den Hintergrund des Videos zu steuern.

DreamMoving lernt aus 1.000 Tanzvideos

Das DreaMoving-System wurde mit über 1.000 Tanzvideos trainiert, die in kurze Clips von 8 bis 10 Sekunden Länge unterteilt wurden, um kontinuierliche Bilder ohne Übergänge und Spezialeffekte zu gewährleisten. Die einzelnen Bilder der Clips wurden für das Training zusätzlich mit MiniGPT-v2-Beschreibungen versehen, um das für Text-Steuerung erforderliche multimodale Training zu ermöglichen.

Video: Alibaba

Durch das Training und die angepasste Architektur ist DreaMoving in der Lage, realistische Videos aus Texteingaben, Bildern oder einer Kombination davon zu erstellen. Das System kann so beispielsweise Videos einer bestimmten Person in einem bestimmten Kleidungsstück generieren, die der Benutzer via Bild zur Verfügung stellt.

Video: Alibaba

Empfehlung

KI-Forschung

KI schlägt Neurowissenschaftler bei der Vorhersage von Forschungsergebnissen

Neben DreamMoving hat Alibaba kürzlich ein ähnliches System namens Animate Anyone vorgestellt, das Videos von animierten Personen erstellen kann, die nicht nur tanzen. Ein ähnliches System gibt es mit MagicAnimate auch von der TikTok-Firma Bytedance.

Weitere Beispiele und Informationen finden sich auf der Projektseite von DreaMoving. Auf HuggingFace gibt es auch eine Demo, bei der eigene Gesichter und Animationen hochgeladen oder aus einer Vorauswahl ausgewählt werden können.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

DreaMoving: Alibaba zeigt TikTok Generator

DreamMoving lernt aus 1.000 Tanzvideos

KI schlägt Neurowissenschaftler bei der Vorhersage von Forschungsergebnissen

xAI-Mitgründer Igor Babuschkin verlässt Musk-Projekt und startet Fonds für KI-Sicherheit

Reuters: USA bauen verdeckte Ortungstechnik in KI-Chip-Lieferungen ein

Perplexity bietet 34,5 Milliarden für Chrome – erneut PR-Stunt wie bei TikTok

OpenAI startet GPT-5 – mit besserem Verständnis, Personalisierung und Entwickler-Tools

Google Deepmind zeigt mit Genie 3 ein KI-Modell für interaktive Welten in Echtzeit

Google schaltet Gemini 2.5 Deep Think frei – und zieht erste Sicherheitsgrenzen

DreaMoving: Alibaba zeigt TikTok Generator

DreamMoving lernt aus 1.000 Tanzvideos

Artikel teilen

Bankverbindung