OpenAIs Video-KI Sora wird "nicht in absehbarer Zeit" veröffentlicht

9. März 2024 Matthias Bastian

In einem Interview mit Marques Brownlee erklärt das Sora-Team, dass Sora "in absehbarer Zeit" nicht veröffentlicht wird. Die aktuelle Version sei noch ein Forschungsprojekt.

In einem Interview mit Marques Brownlee erklärt das Sora-Team, dass Sora nicht "in absehbarer Zeit" veröffentlicht wird. Die aktuelle Version sei noch ein Forschungsprojekt.

"Wir haben noch keinen Zeitplan, wann Sora ein Produkt wird. Wir wollen Feedback für die weitere Forschung erhalten", sagt OpenAI-Forschungsleiter Tim Brooks.

Vor allem die Darstellung von Händen sowie komplexe physikalische Vorgänge und Bewegungen stellten das Modell noch vor Herausforderungen.

Ein erstes Feedback sei, dass die Nutzer mehr Kontrolle über die Videogenerierung wollen als nur über den Text-Prompt. "Das werden wir uns auf jeden Fall ansehen", sagt Brooks. Das Hinzufügen von Audio stehe nicht direkt auf dem Entwicklungsplan, sei aber eine Option.

Fotorealistische, glaubwürdige KI-Videos sind möglich

Das Team hält es perspektivisch für möglich, Videos zu generieren, die von echten Videos nicht mehr zu unterscheiden sind. Um KI-Fake-Videos einzudämmen, will OpenAI den für OpenAIs Bild-KI DALL-E 3 vorgestellten Klassifikator für Sora anpassen, sagt Sora-Teamleiter Aditya Ramesh. Der Bild-Klassifikator kann zuverlässig erkennen, ob ein Bild mit DALL-E 3 erstellt wurde.

Wie lange es dauert, ein Video mit Sora zu erstellen, hänge von verschiedenen Faktoren ab. Es könne eine Weile dauern, sodass man in der Zwischenzeit einen Kaffee trinken gehen könne.

Die Forscher weisen auch auf die potenziell revolutionäre Rolle von Sora für die Kreativwirtschaft hin: Durch die Senkung der Produktionskosten könnten innovative Inhalte ermöglicht werden, die bisher aufgrund finanzieller Hürden nicht realisierbar waren. Sora sei ein Beispiel dafür, wie KI-Tools völlig neue kreative Ausdrucksformen ermöglichen könnten, die weit über die Imitation bestehender Medien hinausgingen.

Eines der Hauptziele von OpenAI mit Sora sei es, dass Modelle wie Sora die Welt besser verstehen, indem sie aus visuellen Daten lernen. OpenAI sieht in Sora den ersten Schritt zur Modellierung der Realität.

Ein nächster Schritt könnte die Entwicklung von Modellen sein, die auf dem visuellen Verständnis von Sora aufbauen und ein Weltverständnis haben. Metas KI-Chef Yann LeCun hält diesen Ansatz für grundfalsch.

Sora wurde mit einer Kombination aus öffentlich verfügbaren und von OpenAI lizenzierten Daten trainiert. Das Modell kombiniert Techniken aus diffusionsbasierten Modellen und Large Language Models (LLMs).

Quellen:

WVFRM Podcast