menu
close

Le système d’IA de Google détecte les deepfakes au-delà de la manipulation des visages

Des chercheurs de l’Université de Californie à Riverside et de Google ont mis au point UNITE, un système d’IA révolutionnaire capable de détecter les deepfakes même lorsque les visages ne sont pas visibles dans les vidéos. Contrairement aux méthodes traditionnelles, UNITE analyse l’ensemble des images vidéo, y compris les arrière-plans et les schémas de mouvement, afin d’identifier les contenus synthétiques ou manipulés. Ce détecteur universel représente une avancée majeure dans la lutte contre les vidéos générées par IA, de plus en plus sophistiquées, qui menacent l’intégrité de l’information.
Le système d’IA de Google détecte les deepfakes au-delà de la manipulation des visages

À mesure que les vidéos générées par intelligence artificielle deviennent de plus en plus convaincantes et accessibles, des chercheurs de l’Université de Californie à Riverside se sont associés à Google pour développer une nouvelle arme puissante contre la tromperie numérique.

Leur système, baptisé Universal Network for Identifying Tampered and synthEtic videos (UNITE), répond à une vulnérabilité critique des technologies actuelles de détection de deepfakes. Alors que les outils existants se concentrent principalement sur les anomalies faciales, UNITE examine l’ensemble des images vidéo, y compris les arrière-plans, les schémas de mouvement et les subtiles incohérences spatio-temporelles révélatrices de manipulations.

« Les deepfakes ont évolué », explique Rohit Kundu, doctorant à UC Riverside et chef de file de la recherche. « Il ne s’agit plus seulement d’échanges de visages. Les gens créent désormais des vidéos entièrement fausses — des visages aux arrière-plans — en utilisant de puissants modèles génératifs. Notre système est conçu pour tout détecter. »

La collaboration, qui a réuni le professeur Amit Roy-Chowdhury et les chercheurs de Google Hao Xiong, Vishal Mohanty et Athula Balachandra, a été présentée lors de la Conférence 2025 sur la vision par ordinateur et la reconnaissance de formes à Nashville. Leur innovation intervient alors que les plateformes de génération de texte en vidéo et d’image en vidéo rendent les falsifications sophistiquées accessibles à presque tout le monde.

UNITE utilise un modèle d’apprentissage profond basé sur les transformers, reposant sur une architecture appelée SigLIP, qui extrait des caractéristiques non limitées à des personnes ou objets spécifiques. Une nouvelle méthode d’entraînement, baptisée « attention-diversity loss », oblige le système à surveiller plusieurs régions visuelles dans chaque image, évitant ainsi une dépendance excessive aux visages.

Bien qu’encore en développement, UNITE pourrait bientôt devenir un outil essentiel pour les plateformes de réseaux sociaux, les rédactions et les vérificateurs de faits cherchant à empêcher la viralité des vidéos manipulées. Alors que les deepfakes menacent de plus en plus la confiance du public, les processus démocratiques et l’intégrité de l’information, des outils de détection universels comme UNITE constituent une ligne de défense cruciale contre la désinformation numérique.

Source:

Latest News