Inhalt
summary Zusammenfassung
Update
  • Der Nutzer guizang.ai bei X hat nach eigenen Angaben bereits Zugang zu dem Modell.
  • Der Zugang erfolgt über eine Smartphone-App, für die eine chinesische Telefonnummer benötigt wird.
  • Bei X zeigt er zahlreiche weitere Prompts und die entsprechenden Ergebnisse. Die Videos sind qualitativ hochwertig, aber nicht länger als fünf Sekunden.
  • Der Nutzer gibt an, keine gezielte Auswahl getroffen zu haben. Alle Videos sollen das erste Ergebnis des jeweiligen Prompts zeigen.

Das chinesische Technologieunternehmen Kuaishou hat mit KLING ein leistungsfähiges KI-Modell zur Videogenerierung vorgestellt. Es könnte OpenAIs Sora Konkurrenz machen.

Laut Kuaishou kann KLING Videos mit einer Länge von bis zu zwei Minuten und einer Auflösung von 1080p bei 30 Bildern pro Sekunde generieren. Dabei soll es in der Lage sein, komplexe Bewegungsabläufe physikalisch korrekt zu modellieren.

Das folgende Video zeigt eine zweiminütige Zugfahrt, die mit dem Prompt "Zugfahrt mit verschiedenen Landschaften, die man durch das Fenster sieht" generiert wurde. OpenAI kündigte Sora Mitte Februar mit einer Videolänge von bis zu einer Minute an.

Video: kling.kuaishou.com

Anzeige
Anzeige

Ein weiteres Beispiel für ein längeres Video zeigt einen Jungen, der im Garten Fahrrad fährt, während sich die Jahreszeiten ändern.

Video: kling.kuaishou.com

Interessant ist auch ein Video von einem Jungen, der in einem Fast-Food-Restaurant einen Cheeseburger isst. Der Burger wird nach dem ersten Bissen kleiner.

Video: kling.kuaishou.com

Ein Messer, das eine Zwiebel schneidet, und ein Mann, der Nudeln von einem Teller isst, sind ähnliche Beispiele für eine physische Interaktion zwischen zwei Objekten, die zu einer Veränderung im Video führt. Diese Beispiele dauern jedoch nur wenige Sekunden, so dass die Konsistenz dieser Simulation nicht eindeutig ist.

Empfehlung

Video: kling.kuaishou.com

KLING verwendet nach Angaben der Entwickler ein 3D-Raum-Zeit-Aufmerksamkeitssystem, um Bewegungen besser modellieren zu können. Außerdem soll es dank eines skalierbaren Frameworks und optimierter Inferenz in der Lage sein, lange, hochauflösende Videos zu erzeugen.

Laut Kuaishou simuliert das Modell physikalische Eigenschaften der realen Welt korrekt. Mithilfe eines "Diffusion Transformers" kann es zudem Konzepte kombinieren und fiktive Szenen erzeugen, wie eine Katze, die ein Auto durch eine belebte Stadt lenkt.

Video: kling.kuaishou.com

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Auch OpenAIs Sora nutzt Diffusion Transformer und bezeichnet den Videogenerator als "Weltensimulator" - allerdings bekam das Start-up für diese steile These auch Gegenwind aus der Fachwelt.

KLING ist derzeit als öffentliche Demo in China verfügbar. Kuaishou ist ein Technologieunternehmen mit Sitz in Peking, das in China vor allem für seine Social-Media-Anwendungen bekannt ist. Mit KLING steigt es nun in den Wettbewerb um leistungsfähige generative KI-Systeme ein.

Der Tech-Investor und Schauspieler Ashton Kutcher hat Zugang zu einer Beta-Version von Sora. Er glaubt, dass generative KI für Video den Bewegtbildmarkt und Hollywood revolutionieren wird.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Kuaishou, ein chinesisches Technologieunternehmen, hat mit KLING ein KI-Modell zur Videogenerierung vorgestellt, das Videos mit einer Länge von bis zu zwei Minuten und einer Auflösung von 1080p bei 30 Bildern pro Sekunde erzeugen kann.
  • KLING soll in der Lage sein, komplexe Bewegungsabläufe physikalisch korrekt zu modellieren und verwendet dazu ein 3D-Raum-Zeit-Aufmerksamkeitssystem. Ein "Diffusion Transformer" ermöglicht die Kombination von Konzepten und die Generierung fiktiver Szenen.
  • Das Modell ist derzeit als öffentliche Demo in China verfügbar und könnte OpenAIs Sora Konkurrenz machen, das nach eigenen Angaben ebenfalls einen "Weltensimulator" entwickelt hat, der auch Videos generieren kann.
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!