AI로 생성된 영상이 점점 더 정교해지고 접근성이 높아지면서, UC 리버사이드 연구진은 구글과 협력해 디지털 조작에 맞설 강력한 신무기를 개발했다.
이 시스템은 'UNITE(Universal Network for Identifying Tampered and synthEtic videos)'로, 기존 딥페이크 탐지 기술의 치명적인 취약점을 해결한다. 기존 도구들이 주로 얼굴의 이상 징후에 집중하는 반면, UNITE는 배경, 움직임 패턴, 미세한 시공간적 불일치 등 영상 전체 프레임을 분석해 조작 여부를 가려낸다.
"딥페이크는 진화했습니다." 연구를 이끈 UC 리버사이드 박사과정 로힛 쿤두는 설명한다. "이제는 단순한 얼굴 교체를 넘어, 강력한 생성 모델로 얼굴부터 배경까지 완전히 가짜 영상을 만들어냅니다. 저희 시스템은 이런 모든 조작을 잡아내도록 설계됐습니다."
이번 공동 연구에는 아밋 로이-초드허리 교수와 구글의 하오 시옹, 비샬 모한티, 아툴라 발라찬드라 연구원이 참여했으며, 이 성과는 내슈빌에서 열린 2025년 컴퓨터 비전 및 패턴 인식 학회(CVPR)에서 발표됐다. 최근 텍스트-투-비디오, 이미지-투-비디오 생성 플랫폼이 등장하면서 누구나 정교한 영상 위조물을 만들 수 있게 된 상황에서 주목받고 있다.
UNITE는 SigLIP이라는 기반 위에 구축된 트랜스포머 기반 딥러닝 모델을 사용한다. 이 모델은 특정 인물이나 사물에 국한되지 않는 특징을 추출한다. 또한 '어텐션 다양성 손실(attention-diversity loss)'이라는 새로운 학습 기법을 적용해, 각 프레임의 여러 시각적 영역을 동시에 감시하도록 유도해 얼굴에만 의존하는 문제를 방지한다.
아직 개발 단계이지만, UNITE는 조만간 소셜미디어 플랫폼, 뉴스룸, 팩트체커 등에서 조작 영상의 확산을 막는 필수 도구가 될 전망이다. 딥페이크가 대중의 신뢰, 민주적 절차, 정보 신뢰성을 위협하는 가운데, UNITE와 같은 범용 탐지 기술은 디지털 허위정보에 맞서는 중요한 방어선이 될 것으로 기대된다.