扫描下载APP
其它方式登录
Netflix发布开源AI视频模型VOID,专攻视频中物体移除后的物理一致性重建,采用Quadmask系统和两阶段扩散推理,显著降低后期制作成本与重拍需求;该模型基于CogVideoX、Gemini和SAM2构建,以Apache 2.0许可开放,旨在参与定义影视AI技术标准,体现其‘开源基础研究、锁死核心工具’的双轨AI战略。
Netflix团队联合提出VOID框架,解决视频编辑中物体移除后的物理因果推理难题:不仅删除目标物体,还建模其消失引发的连锁物理反应(如多米诺骨牌停止倒下、陀螺继续旋转)。该方法基于CogVideoX模型,引入VLM引导的四值掩码和两阶段推理,在人类偏好与VLM裁判评估中显著超越现有方案,展现出对未见物理交互的泛化能力。