Netflix-KI-Framework VOID entfernt Objekte aus Videos und passt physikalische Effekte an
Netflix hat ein Open-Source-KI-System zur Objektentfernung in Videos veröffentlicht. Das Framework namens VOID ("Video Object and Interaction Deletion") entfernt Objekte aus Videos und passt dabei auch physikalische Auswirkungen wie Kollisionen im restlichen Video an.
VOID baut auf Alibabas Video-Diffusionsmodell CogVideoX auf, das mit synthetischen Daten aus Googles Kubric und Adobes HUMOTO für die Interaktionserkennung feinabgestimmt wurde. Googles Gemini 3 Pro analysiert die Szene und erkennt betroffene Bereiche, Metas SAM2 segmentiert die zu entfernenden Objekte. Ein optionaler zweiter Durchlauf korrigiert Formverzerrungen mithilfe von optischem Fluss.
Das Projekt wurde von Netflix-Forschern gemeinsam mit der Universität INSAIT Sofia entwickelt. Code, Paper und Demo sind auf GitHub, arXiv und Hugging Face verfügbar. Das System ist mit der Apache-2.0-Lizenz verfügbar, darf also kommerziell genutzt werden.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den "KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnieren