OpenAIs Video-KI Sora wird "nicht in absehbarer Zeit" veröffentlicht

In einem Interview mit Marques Brownlee erklärt das Sora-Team, dass Sora nicht "in absehbarer Zeit" veröffentlicht wird. Die aktuelle Version sei noch ein Forschungsprojekt.

"Wir haben noch keinen Zeitplan, wann Sora ein Produkt wird. Wir wollen Feedback für die weitere Forschung erhalten", sagt OpenAI-Forschungsleiter Tim Brooks.

Vor allem die Darstellung von Händen sowie komplexe physikalische Vorgänge und Bewegungen stellten das Modell noch vor Herausforderungen.

Ein erstes Feedback sei, dass die Nutzer mehr Kontrolle über die Videogenerierung wollen als nur über den Text-Prompt. "Das werden wir uns auf jeden Fall ansehen", sagt Brooks. Das Hinzufügen von Audio stehe nicht direkt auf dem Entwicklungsplan, sei aber eine Option.

Fotorealistische, glaubwürdige KI-Videos sind möglich

Das Team hält es perspektivisch für möglich, Videos zu generieren, die von echten Videos nicht mehr zu unterscheiden sind. Um KI-Fake-Videos einzudämmen, will OpenAI den für OpenAIs Bild-KI DALL-E 3 vorgestellten Klassifikator für Sora anpassen, sagt Sora-Teamleiter Aditya Ramesh. Der Bild-Klassifikator kann zuverlässig erkennen, ob ein Bild mit DALL-E 3 erstellt wurde.

Wie lange es dauert, ein Video mit Sora zu erstellen, hänge von verschiedenen Faktoren ab. Es könne eine Weile dauern, sodass man in der Zwischenzeit einen Kaffee trinken gehen könne.

Die Forscher weisen auch auf die potenziell revolutionäre Rolle von Sora für die Kreativwirtschaft hin: Durch die Senkung der Produktionskosten könnten innovative Inhalte ermöglicht werden, die bisher aufgrund finanzieller Hürden nicht realisierbar waren. Sora sei ein Beispiel dafür, wie KI-Tools völlig neue kreative Ausdrucksformen ermöglichen könnten, die weit über die Imitation bestehender Medien hinausgingen.

Eines der Hauptziele von OpenAI mit Sora sei es, dass Modelle wie Sora die Welt besser verstehen, indem sie aus visuellen Daten lernen. OpenAI sieht in Sora den ersten Schritt zur Modellierung der Realität.

Empfehlung

KI in der Praxis

OpenAI startet Codex: Autonome KI-Agenten für die Softwareentwicklung

Ein nächster Schritt könnte die Entwicklung von Modellen sein, die auf dem visuellen Verständnis von Sora aufbauen und ein Weltverständnis haben. Metas KI-Chef Yann LeCun hält diesen Ansatz für grundfalsch.

Sora wurde mit einer Kombination aus öffentlich verfügbaren und von OpenAI lizenzierten Daten trainiert. Das Modell kombiniert Techniken aus diffusionsbasierten Modellen und Large Language Models (LLMs).

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

OpenAIs Video-KI Sora wird "nicht in absehbarer Zeit" veröffentlicht

Fotorealistische, glaubwürdige KI-Videos sind möglich

OpenAI startet Codex: Autonome KI-Agenten für die Softwareentwicklung

OpenAIs KI-Videogenerator Sora startet in Europa

OpenAI arbeitet an verbesserter Version seiner Video-KI Sora

OpenAI lässt sich Zeit mit der Veröffentlichung seiner Video-KI Sora

Katzen-Attacke auf Reasoning-Modell zeigt, wie wichtig "Context Engineering" ist

Neue Studie relativiert Apples Kritik an KI-Reasoning

Cloudflare-Boss Matthew Prince hat schlechte Nachrichten für das WWW

OpenAIs Video-KI Sora wird "nicht in absehbarer Zeit" veröffentlicht

Fotorealistische, glaubwürdige KI-Videos sind möglich

Artikel teilen

Bankverbindung