OpenAIs Video-KI Sora wird "nicht in absehbarer Zeit" veröffentlicht
In einem Interview mit Marques Brownlee erklärt das Sora-Team, dass Sora nicht "in absehbarer Zeit" veröffentlicht wird. Die aktuelle Version sei noch ein Forschungsprojekt.
"Wir haben noch keinen Zeitplan, wann Sora ein Produkt wird. Wir wollen Feedback für die weitere Forschung erhalten", sagt OpenAI-Forschungsleiter Tim Brooks.
Vor allem die Darstellung von Händen sowie komplexe physikalische Vorgänge und Bewegungen stellten das Modell noch vor Herausforderungen.
Ein erstes Feedback sei, dass die Nutzer mehr Kontrolle über die Videogenerierung wollen als nur über den Text-Prompt. "Das werden wir uns auf jeden Fall ansehen", sagt Brooks. Das Hinzufügen von Audio stehe nicht direkt auf dem Entwicklungsplan, sei aber eine Option.
Fotorealistische, glaubwürdige KI-Videos sind möglich
Das Team hält es perspektivisch für möglich, Videos zu generieren, die von echten Videos nicht mehr zu unterscheiden sind. Um KI-Fake-Videos einzudämmen, will OpenAI den für OpenAIs Bild-KI DALL-E 3 vorgestellten Klassifikator für Sora anpassen, sagt Sora-Teamleiter Aditya Ramesh. Der Bild-Klassifikator kann zuverlässig erkennen, ob ein Bild mit DALL-E 3 erstellt wurde.
Wie lange es dauert, ein Video mit Sora zu erstellen, hänge von verschiedenen Faktoren ab. Es könne eine Weile dauern, sodass man in der Zwischenzeit einen Kaffee trinken gehen könne.
Die Forscher weisen auch auf die potenziell revolutionäre Rolle von Sora für die Kreativwirtschaft hin: Durch die Senkung der Produktionskosten könnten innovative Inhalte ermöglicht werden, die bisher aufgrund finanzieller Hürden nicht realisierbar waren. Sora sei ein Beispiel dafür, wie KI-Tools völlig neue kreative Ausdrucksformen ermöglichen könnten, die weit über die Imitation bestehender Medien hinausgingen.
Eines der Hauptziele von OpenAI mit Sora sei es, dass Modelle wie Sora die Welt besser verstehen, indem sie aus visuellen Daten lernen. OpenAI sieht in Sora den ersten Schritt zur Modellierung der Realität.
Ein nächster Schritt könnte die Entwicklung von Modellen sein, die auf dem visuellen Verständnis von Sora aufbauen und ein Weltverständnis haben. Metas KI-Chef Yann LeCun hält diesen Ansatz für grundfalsch.
Sora wurde mit einer Kombination aus öffentlich verfügbaren und von OpenAI lizenzierten Daten trainiert. Das Modell kombiniert Techniken aus diffusionsbasierten Modellen und Large Language Models (LLMs).
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnierenKI-News ohne Hype
Von Menschen kuratiert.
- Mehr als 20 Prozent Launch-Rabatt.
- Lesen ohne Ablenkung – keine Google-Werbebanner.
- Zugang zum Kommentarsystem und Austausch mit der Community.
- Wöchentlicher KI-Newsletter.
- 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
- Bis zu 25 % Rabatt auf KI Pro Online-Events.
- Zugang zum kompletten Archiv der letzten zehn Jahre.
- Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.