Anzeige
Skip to content

Runway Gen 2: Neues Text-zu-Video-Modell ist jetzt verfügbar

Image description
Runway

Update vom 06. Juni 2023:

Runway Gen-2 ist ab sofort im Browser und in der Smartphone-App für iOS verfügbar. Der folgende Trailer zeigt einige der neuen Features.

Video: RunwayML

Ursprünglicher Artikel vom 20. März 2023:

Anzeige
DEC_D_Incontent-1

Das New Yorker Web-Videoeditor Start-up Runway stellt mit Gen-2 ein neues Text-zu-Video-Modell vor.

Erst im Februar hatte Runway das Modell Gen-1 vorgestellt, das vorhandenen Videos ein neues Aussehen überstülpen kann. Aus einer realistisch gefilmten Szene wird beispielsweise per Sprachbefehl eine Comic-Welt, die die Proportionen und Bewegungen des Originals beibehält.

Das funktioniert für Personen und für Umgebungen, und das auf einem hohen Abstraktionsniveau: Aus nebeneinander liegenden Notizbüchern macht Gen-1 beispielsweise per Textbefehl eine Skyline. All diese Fähigkeiten stecken auch im neuen Modell Gen-2 von Runway.

Runway startet mit Text-zu-Video-Modell

Gen-2 geht aber noch einen Schritt weiter und generiert aus einem Prompt völlig neue Videoszenen. Die folgende dreisekündige Videoszene wurde von Runway mit dem Prompt "Aerial drone footage of a mountain range" generiert. Audio ist noch nicht dabei, wird laut Runway aber gerade erforscht.

Anzeige
DEC_D_Incontent-2

Video: Runway

Prompt: "A close-up of an eye." | Video: Runway

Darüber hinaus kann Runway kurze Videosequenzen auf der Grundlage eines Bildes oder aus der Kombination eines Bildes mit einer Textbeschreibung erzeugen. Links im Screenshot ist das Eingabebild zu sehen, das in eine kurze Videoanimation umgewandelt wird (rechts, groß im Bild). Die Szene im Hintergrund ändert sich entsprechend der Textanweisung.

Bild: Runway

Wie Bloomberg nach einer Demonstration berichtet, soll die Generierung eines Videos "innerhalb von Minuten" erfolgen. Allerdings ist die Ausgabe nur wenige Sekunden lang und die generierten Sequenzen enthalten viele Bildfehler und ruckeln. Insbesondere Bewegungsabläufe stellen für das Modell noch eine Herausforderung dar. Dafür passen die generierten Szenen zum Textbefehl.

Video: Runway

Verteilung per Discord-Warteliste

Runway macht Gen-2 ausgewählten Testern und Testerinnen zugänglich, die sich über Discord auf eine Warteliste eintragen. Die Ausrollung soll kontinuierlich stattfinden. Gen-1 hat laut Runway derzeit "tausende Nutzer". Einen möglichen Missbrauch des Videosystems etwa für gewalthaltige Inhalte will Runway durch eine Kombination aus KI-Mechanismen mit der Hilfe menschlicher Moderator:innen verhindern.

Neben Runway arbeitet Google am Text-zu-Video-KI-System Phenaki und Meta an Make-a-Video. Meta hat mit Dreamix ein weiteres Modell speziell für die Videobearbeitung per Text in Arbeit. Für den Fall, dass sich die raschen Fortschritte bei KI-Bildgenerierung auf Videos übertragen, sollten Datenbanken mit Stock-Video-Sequenzen schon mal das Geschäftsmodell überdenken.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: Runway | Bloomberg | Arxiv

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren