AI生成動画がますます巧妙かつ手軽に作成できるようになる中、カリフォルニア大学リバーサイド校の研究者とGoogleは、デジタル詐欺への強力な新兵器を共同開発した。
彼らが開発した「UNITE(Universal Network for Identifying Tampered and synthEtic videos)」は、現行のディープフェイク検出技術が抱える重大な弱点に対応するものだ。従来のツールが主に顔の異常に着目していたのに対し、UNITEは動画全体のフレーム、背景、動きのパターン、さらには微妙な時空間の不整合まで解析し、改ざんの痕跡を見抜く。
「ディープフェイクは進化しています」と、研究を主導したUCリバーサイドの博士課程学生、ロヒット・クンドゥ氏は語る。「もはや顔のすり替えだけではありません。強力な生成モデルを使って、顔から背景まで完全に偽の動画が作られています。私たちのシステムは、それらすべてを検出するために設計されています。」
この共同研究には、アミット・ロイ=チョウドリー教授とGoogleのハオ・ション、ヴィシャル・モハンティ、アトゥラ・バラチャンドラ各氏が参加し、成果は2025年のコンピュータビジョンとパターン認識に関する国際会議(CVPR)ナッシュビル大会で発表された。テキストから動画、画像から動画を生成するプラットフォームの登場により、巧妙な動画偽造が誰でも手軽に行えるようになった今、この技術は大きな意義を持つ。
UNITEは、SigLIPと呼ばれる基盤技術上に構築されたトランスフォーマーベースの深層学習モデルを採用している。これは特定の人物や物体に依存しない特徴を抽出できる。また、「アテンション・ダイバーシティ・ロス」と呼ばれる新たな学習手法により、各フレーム内の複数の視覚領域を同時に監視し、顔への過度な依存を防ぐ。
UNITEは現在も開発中だが、今後はSNSプラットフォームや報道機関、ファクトチェッカーが改ざん動画の拡散防止に活用するための不可欠なツールとなる可能性が高い。ディープフェイクが社会的信頼や民主的プロセス、情報の信頼性を脅かす中、UNITEのような汎用検出ツールはデジタル偽情報への重要な防衛線となるだろう。