OpenAIs lang erwarteter KI-Videogenerator ist da. Es ist ein eigenständiges Produkt, das aber dennoch im ChatGPT-Abo enthalten ist.
OpenAI veröffentlicht Sora im Laufe des Tages unter Sora.com für die USA und "die meisten Länder", allerdings nicht in den meisten EU-Ländern und UK. Einen Grund hierfür nennt OpenAI-CEO Sam Altman nicht, aber bis zum Launch könne es noch eine Weile dauern. In Deutschland ist das Modell noch nicht verfügbar.
Update: Altman sagt bei X, dass der späte Start von Sora in der EU auf die EU-KI-Regulierung zurückzuführen sei, ohne den konkreten Grund zu nennen. Generell sei aufgrund der Regulierung damit zu rechnen, dass OpenAI-Modelle in Zukunft später oder gar nicht in der EU starten werden.
Sora ist ein eigenständiges Produkt mit einer eigenen Benutzeroberfläche. ChatGPT-Plus- und -Pro-Abonnenten haben jedoch über ihr ChatGPT-Abonnement Zugriff darauf, es fallen keine zusätzlichen Gebühren an.
ChatGPT-Plus-Abonnements sind auf 50 Generierungen (720p) pro Monat mit einer Länge von bis zu 5 Sekunden beschränkt.
Pro-Abonnements bieten unbegrenzte langsame Generierungen von bis zu fünf Videos gleichzeitig, 500 schnelle Generierungen und zusätzlich Zugang zu einer Auflösung von 1080p. Hier beträgt die maximale Länge eines Videos 20 Sekunden. Als OpenAI Sora im Februar vorstellte, hieß es, dass Videos bis zu einer Minute lang sein können. Die Animation von hochgeladenen Fotos mit Personen darauf ist nur in der Pro-Version verfügbar.
Das jetzt veröffentlichte Modell ist laut OpenAI eine Turbo-Version, also eine auf Kosten und Geschwindigkeit getrimmte Variante des im Februar vorgestellten Sora-Modells. Die Grundfunktionen sind wie beim originalen Sora-Modell Text-zu-Video, Bild-zu-Video und Video-zu-Video, mit zusätzlichen Funktionen wie Remix für bestehende Videos.
"Re-cut" eignet sich zum Herausschneiden und Verlängern einzelner Szenen. Auch das nahtlose Zusammenfügen von Videos ("Blend") und das Erstellen von Endlosschleifen ("Loop") sind möglich.
Das Tool bietet zudem verschiedene Stilvorlagen, darunter einen "Cardboard & Papercraft"-Stil, der Szenen in Karton- und Papieroptik verwandelt, sowie einen "Film Noir"-Look.
Beeindruckender Videogenerator ohne Verständnis für Physik
Nach einer Woche intensiver Tests mit OpenAIs neuem KI-Videogenerator Sora zieht der bekannte Tech-Youtuber Marques Brownlee (MKBHD) ein differenziertes Fazit. Laut Brownlee beeindruckt das Tool besonders bei abstrakten Darstellungen und Cartoon-Animationen mit hoher visueller Qualität.
Allerdings offenbart Sora deutliche Schwächen beim physikalischen Verständnis. Nach Brownlees Beobachtungen fehlt dem System eine grundlegende Objektpermanenz: Gegenstände erscheinen und verschwinden willkürlich oder ändern ihre Position auf unnatürliche Weise.
Laut Brownlee ist Sora daher ein Paradebeispiel dafür, dass KI-Generatoren durch Mustervergleich beeindruckende Ergebnisse erzielen können, aber kein echtes Verständnis der Welt haben und folglich auch nicht als Weltmodell taugen. Die Entwicklung eines Weltmodells, das aus Videos lernt, ist OpenAIs eigentliches Forschungsziel hinter Sora.
Besonders auffällig wird dieses Defizit laut dem Youtuber bei der Darstellung von Menschen und Tieren. Hier kommt es häufig zu anatomisch unmöglichen Bewegungen, etwa wenn Beine plötzlich ihre Position tauschen. Flüssigkeiten wie Wasser oder Feuer hingegen würden erstaunlich realistisch dargestellt.
Die Generierungsgeschwindigkeit variiert nach Brownlees Tests je nach Auflösung: Während 480p-Videos in unter 20 Sekunden erstellt werden, kann die Generierung von 1080p-Videos mit komplexen Prompts mehrere Minuten dauern.
Potenzial für abstrakte Inhalte und Cartoon-Stil
Brownlee sieht das größte Potenzial von Sora in der Erstellung abstrakter Inhalte, Textanimationen und Videos im Cartoon-Stil. Der Cartoon-Stil habe dabei den Vorteil, dass physikalische Ungereimtheiten als stilistische Entscheidung interpretiert werden können.
Trotz integrierter Sicherheitsvorkehrungen wie Wasserzeichen, das für Pro-Nutzer entfernbar ist, äußert Brownlee Bedenken: Das Tool könnte zur Verbreitung von Falschinformationen missbraucht werden. Sora sei ein Vorgeschmack auf eine nahe Zukunft, in der KI-generierte Medien allgegenwärtig sein werden.