随着AI生成视频变得愈发逼真且易于获取,加州大学河滨分校的研究团队携手谷歌,开发出一项强有力的新武器,以对抗数字欺诈。
他们的系统名为“通用篡改与合成视频识别网络”(Universal Network for Identifying Tampered and synthEtic videos,简称UNITE),针对当前深度伪造检测技术的关键短板进行了突破。现有工具主要聚焦于人脸异常,而UNITE则会检查整个视频帧,包括背景、运动模式以及揭示篡改的微妙时空不一致性。
“深度伪造技术已经进化了,”带头研究的加州大学河滨分校博士生Rohit Kundu解释道,“现在不仅仅是换脸。人们正在利用强大的生成模型,制作从人脸到背景的完全虚假视频。我们的系统正是为应对这一切而设计的。”
此次合作由Amit Roy-Chowdhury教授、谷歌研究员Hao Xiong、Vishal Mohanty和Athula Balachandra共同参与,并在2025年于纳什维尔举办的计算机视觉与模式识别大会(CVPR)上发布。随着文本生成视频、图像生成视频等平台让复杂的视频伪造变得几乎人人可及,这项创新显得尤为重要。
UNITE采用基于transformer的深度学习模型,底层架构为SigLIP,能够提取不依赖于特定人物或物体的特征。其独创的训练方法“注意力多样性损失”(attention-diversity loss),促使系统在每一帧中关注多个视觉区域,避免对人脸的过度依赖。
尽管仍处于开发阶段,UNITE有望很快成为社交媒体平台、新闻编辑部和事实核查机构防止篡改视频传播的重要工具。随着深度伪造日益威胁公众信任、民主进程和信息完整性,像UNITE这样的通用检测工具正成为抵御数字虚假信息的关键防线。