OpenAI führt ab heute seinen Videogenerator Sora in Großbritannien und Europa ein. Sora steht ChatGPT Pro- und Plus-Abonnenten ohne zusätzliche Kosten zur Verfügung - allerdings mit einigen Einschränkungen.
Sora wurde bereits im Dezember 2024 in den USA und "den meisten Ländern" veröffentlicht. Die damalige Verzögerung für die EU und Großbritannien hing laut OpenAI-CEO Sam Altman unter anderem mit der KI-Regulierung der EU zusammen.
Technisch bietet Sora je nach Abonnement unterschiedliche Leistungsstufen: Zu Beginn waren ChatGPT-Plus-Nutzer auf 50 Generierungen (720p) pro Monat mit einer Länge von bis zu 5 Sekunden beschränkt, während Pro-Abonnenten unbegrenzte langsame Generierungen, 500 schnelle Generierungen und Zugang zu 1080p-Auflösung mit einer maximalen Videolänge von 20 Sekunden erhielten.
Die Funktion "Remix" ermöglicht das Ersetzen, Entfernen oder Neuinterpretieren von Elementen in Videos. Mit "Re-Cut" können Nutzer die besten Frames identifizieren und in beide Richtungen erweitern, um eine Szene zu vervollständigen. Das "Storyboard"-Feature ermöglicht die Organisation und Bearbeitung einzigartiger Videosequenzen auf einer persönlichen Zeitleiste.
Mit der "Loop"-Funktion können Benutzer Videos zuschneiden und nahtlose Endloswiederholungen erstellen, und mit der "Blend"-Funktion können zwei Videos nahtlos zu einem Clip zusammengefügt werden. Vordefinierte Stile (Presets) wie Film Noir oder Pappmaché stehen ebenfalls zur Verfügung.
Für den Austausch innerhalb der kreativen Community will OpenAI außerdem neue Sora-Channels auf Discord starten. Das OpenAI-Team plant außerdem die ersten öffentlichen "Sora Office Hours" und eine Masterclass auf dem Kanal am Freitag von 20:00 bis 21:00 Uhr.
Sora im wachsenden Wettbewerb
Sora zeigte bereits zum Zeitpunkt der Veröffentlichung deutliche Schwächen im physikalischen Verständnis. Dem System fehlt eine grundlegende Objektpermanenz, so dass Objekte willkürlich erscheinen und verschwinden oder ihre Position unnatürlich verändern können. Insbesondere bei der Darstellung von Menschen und Tieren kommt es häufig zu anatomisch unmöglichen Bewegungen.
Inzwischen hat sich ein intensiver Wettbewerb entwickelt: Modelle wie das kürzlich als Open Source veröffentlichte Wan 2.1 von Alibaba oder Google DeepMinds Veo 2 mit 4K-Ausgabequalität bieten vergleichbare oder sogar bessere Funktionen und Qualität. Auch Adobes Firefly Video Model mit seiner nahtlosen Integration in die Creative Cloud, Runways Gen-3 Alpha, spezialisierte Lösungen wie KLING und Tencents Open-Source-Modell HunyuanVideo zeigen, dass der Markt für KI-Videogeneratoren hart umkämpft ist. Möglicherweise wird Sora ein ähnliches Schicksal erleiden wie OpenAIs Bildgenerator DALL-E 3: Auch dieses Modell zeigte in den ersten Enthüllungen beeindruckende Leistungen, wurde aber sehr schnell von der Konkurrenz überholt.