Inhalt
summary Zusammenfassung

Das chinesische KI-Start-up MiniMax hat mit abab-video-1, auch nur Video-01 genannt, sein erstes KI-Modell zur Generierung hochauflösender Videos aus Textprompts veröffentlicht.

Anzeige

Über die technischen Hintergründe, etwa das verwendete Trainingsmaterial und die Architektur, hat MiniMax noch keine Informationen herausgegeben. MiniMax-CEO Yan Junjie hat das Modell auf einer hauseigenen Veranstaltung vorgestellt und einige Eckdaten genannt.

HD-Auflösung bei 25 Bildern pro Sekunde

So unterstützt Video-01 eine native Auflösung von 1.280 x 720 Pixeln bei flüssigen 25 Bildern pro Sekunde und akzeptiert auch Anweisungen zur virtuellen Kameraführung. Derzeit ist die Videolänge auf sechs Sekunden begrenzt, das Unternehmen plant jedoch, die Videolänge demnächst auf bis zu zehn Sekunden zu erweitern.

MiniMax will nach Aussage des Geschäftsführers regelmäßig Updates für den Videogenerator herausbringen. Unter anderem sollen neben Texten auch Bilder als Input dienen. Zudem sollen die Nutzer:innen mehr Kontrolle über das Endergebnis bekommen.

Anzeige
Anzeige

Welche weiteren Funktionen in einem KI-Video-Tool sinnvoll sein könnten, zeigt der westliche Konkurrent Runway. Yan betonte jedoch, dass der Fokus derzeit auf der breiten Zugänglichkeit der Technologie liege und nicht auf der Kommerzialisierung.

Kostenlose Nutzung per Website, auch API verfügbar

Ab sofort können Interessierte Video-01 kostenfrei auf der offiziellen Plattform hailuoai.com/video ausprobieren. Voraussetzung ist lediglich eine Registrierung per Mobilfunknummer, die auch mit nicht-chinesischen Nummern funktioniert. Zudem stellt MiniMax bereits jetzt eine API für Entwickler:innen zur Verfügung.

Die mit Video-01 generierten Videos lassen sich mit bloßem Auge noch recht einfach als KI-gemacht ausmachen. Ein wenig erinnert die Synthese "echter" Videos, als wäre ein starker Filter darübergelegt worden.

Video: Video-01 prompted by MiniMax

Die Farben sind etwas zu grell, die Oberflächen zu glatt. Video-01 beherrscht aber auch andere Stile wie Anime, CGI oder Videospielgrafik. Zudem glänzt Video-01 mit wenigen Bildfehlern oder Artefakten. Selbst die Darstellung von Schrift im Video scheint das Modell zu beherrschen.

Empfehlung

Video: Video-01 prompted by MiniMax

Video: Video-01 prompted by MiniMax

Video: Video-01 prompted by MiniMax

Video: Video-01 prompted by MiniMax

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Nur wenige inhaltliche Grenzen

Nach der Registrierung fordert MiniMax die Nutzer:innen dazu auf, die Nutzungsbedingungen zu akzeptieren. Dazu gehört auch das Einverständnis, das Tool "nicht zur Generierung illegaler Inhalte" zu nutzen.

"Bitte nutzen Sie diese Funktion nicht, um Gerüchte zu verbreiten, zu verleumden, die Privatsphäre anderer zu verletzen, illegale Informationen zu verbreiten usw. Andernfalls werden Sie alle Konsequenzen tragen müssen", heißt es weiter.

Damit macht es sich MiniMax leicht. Der Fantasie der KI scheinen kaum Grenzen gesetzt zu sein, selbst berühmte Persönlichkeiten lassen sich in wenigen Minuten in bewegten Bildern generieren.

Video: Video-01 prompted by THE DECODER

Auf der einen Seite lässt sich damit problemlos der berühmte Test durchführen, ob Will Smith realistisch eine Schüssel Spaghetti essen kann. Auf der anderen Seite erzeugt Video-01 mit Leichtigkeit intime Szenen zwischen Wladimir Putin und Donald Trump.

Video: Video-01 prompted by THE DECODER

Anzeige
Anzeige

Pornografische oder andere explizite Szenen blockiert das Tool hingegen vehement. Generierte Videos werden in der rechten unteren Ecke mit einem dezenten Wasserzeichen versehen.

MiniMax wurde Ende 2021 gegründet und bietet neben dem neuen Videogenerator unter anderem auch ein großes Sprachmodell sowie ein Text-to-Speech-Modell an. Im Frühjahr 2024 erreichte eine von Alibaba angeführte Finanzierungsrunde rund 600 Millionen Dollar an Investitionen, darunter ebenso Tech-Gigant Tencent. Das brachte MiniMax auf eine Bewertung von mindestens 2,5 Milliarden US-Dollar.

OpenAIs Sora gilt in der Industrie immer noch als Maßstab für Video-KI. Präsentiert im Februar 2024, war Sora damals noch ein Meilenstein. Seitdem haben sich jedoch zahlreiche Unternehmen, vor allem aus China, ebenfalls an einer Video-KI versucht und im Gegensatz zu OpenAI diese auch für Nutzer:innen verfügbar gemacht. Dazu zählen etwa KLING, Vidu oder Jimeng AI.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Das chinesische KI-Start-up MiniMax hat mit Video-01 ein KI-Modell zur Generierung hochauflösender Videos aus Textanweisungen veröffentlicht, das eine Auflösung von 1.280 x 720 Pixeln bei 25 Bildern pro Sekunde unterstützt. Bisher sind die Videos auf sechs Sekunden begrenzt.
  • Video-01 ist ab sofort kostenlos auf der MiniMax-Website verfügbar, eine Registrierung per Mobilfunknummer ist erforderlich. Eine API für Entwickler wird ebenfalls bereitgestellt. Die generierten Videos sind noch erkennbar KI-generiert, bieten aber verschiedene Stile und haben recht wenige Bildfehler.
  • MiniMax sammelte in einer Finanzierungsrunde Anfang 2024 rund 600 Millionen Dollar ein, angeführt von Alibaba und mit Beteiligung von Tencent. Das Unternehmen bietet neben Video-01 auch ein großes Sprachmodell und ein Text-to-Speech-Modell an. Mehrere chinesische Firmen haben inzwischen ähnliche Video-KI-Tools veröffentlicht.
Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!