menu
close

Le système d’IA de Google détecte les deepfakes au-delà de la manipulation faciale

Des chercheurs de l’Université de Californie à Riverside et Google ont mis au point UNITE, un système d’IA révolutionnaire capable de détecter les deepfakes même lorsque les visages ne sont pas visibles dans les vidéos. Contrairement aux méthodes traditionnelles, UNITE analyse l’ensemble des images vidéo, y compris les arrière-plans et les motifs de mouvement, afin d’identifier les contenus synthétiques ou manipulés. Ce détecteur universel représente une avancée majeure dans la lutte contre les vidéos générées par IA, de plus en plus sophistiquées, qui menacent l’intégrité de l’information.
Le système d’IA de Google détecte les deepfakes au-delà de la manipulation faciale

À mesure que les vidéos générées par l’IA deviennent de plus en plus convaincantes et accessibles, des chercheurs de l’Université de Californie à Riverside se sont associés à Google pour développer une nouvelle arme puissante contre la désinformation numérique.

Leur système, appelé Universal Network for Identifying Tampered and synthEtic videos (UNITE), cible une vulnérabilité critique des technologies actuelles de détection de deepfakes. Alors que les outils existants se concentrent principalement sur les anomalies faciales, UNITE examine l’ensemble des images vidéo, y compris les arrière-plans, les motifs de mouvement et les subtiles incohérences spatio-temporelles qui trahissent une manipulation.

« Les deepfakes ont évolué », explique Rohit Kundu, doctorant à UC Riverside et chef de file de la recherche. « Il ne s’agit plus seulement d’échanger des visages. On crée maintenant des vidéos entièrement fausses — des visages jusqu’aux arrière-plans — à l’aide de puissants modèles génératifs. Notre système est conçu pour détecter tout cela. »

La collaboration, qui inclut le professeur Amit Roy-Chowdhury ainsi que les chercheurs de Google Hao Xiong, Vishal Mohanty et Athula Balachandra, a été présentée à la Conférence sur la vision par ordinateur et la reconnaissance de formes 2025 à Nashville. Leur innovation arrive alors que les plateformes de génération texte-vers-vidéo et image-vers-vidéo rendent les faux vidéos sophistiqués accessibles à presque tout le monde.

UNITE utilise un modèle d’apprentissage profond basé sur les transformateurs, construit sur une base appelée SigLIP, qui extrait des caractéristiques non liées à des personnes ou objets spécifiques. Une nouvelle méthode d’entraînement, appelée « attention-diversity loss », oblige le système à surveiller plusieurs régions visuelles dans chaque image, évitant ainsi une dépendance excessive aux visages.

Bien qu’encore en développement, UNITE pourrait bientôt devenir essentiel pour les plateformes de médias sociaux, les salles de rédaction et les vérificateurs de faits cherchant à empêcher la viralité des vidéos manipulées. Alors que les deepfakes menacent de plus en plus la confiance du public, les processus démocratiques et l’intégrité de l’information, des outils de détection universels comme UNITE représentent une ligne de défense cruciale contre la désinformation numérique.

Source:

Latest News