Command Palette
Search for a command to run...
Shuhai Zhang ZiHao Lian Jiahao Yang Daiyuan Li Guoxuan Pang Feng Liu Bo Han Shutao Li Mingkui Tan

摘要
生成式AI视频已实现近乎完美的视觉真实感(如Sora模型),迫切需要可靠的检测机制。然而,检测此类视频面临建模高维时空动态以及识别违反物理规律的细微异常等重大挑战。本文提出一种基于概率流守恒原理的物理驱动型生成视频检测范式。具体而言,我们提出一种名为“归一化时空梯度”(Normalized Spatiotemporal Gradient, NSG)的统计量,用于量化空间概率梯度与时间密度变化的比值,从而显式捕捉与自然视频动态的偏离。通过利用预训练的扩散模型,我们设计了一种NSG估计器,该方法通过空间梯度近似与运动感知的时间建模实现,无需复杂的运动分解过程,同时严格保持物理约束。在此基础上,我们提出一种基于NSG的视频检测方法(NSG-VD),以测试视频与真实视频NSG特征之间的最大均值差异(Maximum Mean Discrepancy, MMD)作为检测指标。最后,我们推导出真实视频与生成视频之间NSG特征距离的上界,证明由于分布偏移,生成视频表现出被放大的差异性。大量实验表明,NSG-VD在召回率(Recall)上优于现有最先进基线方法16.00%,在F1分数(F1-Score)上提升10.75%,充分验证了NSG-VD方法的优越性能。