menu
close

El sistema de IA de Google detecta deepfakes más allá de la manipulación facial

Investigadores de UC Riverside y Google han desarrollado UNITE, un sistema de inteligencia artificial revolucionario capaz de detectar deepfakes incluso cuando los rostros no son visibles en los videos. A diferencia de los métodos tradicionales, UNITE analiza todos los cuadros del video, incluyendo fondos y patrones de movimiento, para identificar contenido sintético o manipulado. Este detector universal representa un avance significativo en la lucha contra los videos generados por IA cada vez más sofisticados que amenazan la integridad de la información.
El sistema de IA de Google detecta deepfakes más allá de la manipulación facial

A medida que los videos generados por inteligencia artificial se vuelven cada vez más convincentes y accesibles, investigadores de UC Riverside se han asociado con Google para desarrollar una poderosa nueva herramienta contra el engaño digital.

Su sistema, llamado Red Universal para Identificar Videos Manipulados y Sintéticos (UNITE, por sus siglas en inglés), aborda una vulnerabilidad crítica en la tecnología actual de detección de deepfakes. Mientras que las herramientas existentes se enfocan principalmente en anomalías faciales, UNITE examina todos los cuadros del video, incluyendo fondos, patrones de movimiento y sutiles inconsistencias espacio-temporales que revelan manipulaciones.

"Los deepfakes han evolucionado", explica Rohit Kundu, candidato a doctorado en UC Riverside y líder de la investigación. "Ya no se trata solo de intercambiar rostros. Ahora la gente crea videos completamente falsos, desde los rostros hasta los fondos, utilizando potentes modelos generativos. Nuestro sistema está diseñado para detectar todo eso".

La colaboración, que incluyó al profesor Amit Roy-Chowdhury y a los investigadores de Google Hao Xiong, Vishal Mohanty y Athula Balachandra, fue presentada en la Conferencia sobre Visión por Computadora y Reconocimiento de Patrones 2025 en Nashville. Esta innovación surge en un contexto donde las plataformas de generación de texto a video e imagen a video han hecho que las falsificaciones sofisticadas sean accesibles prácticamente para cualquiera.

UNITE emplea un modelo de aprendizaje profundo basado en transformadores, construido sobre una base llamada SigLIP, que extrae características no ligadas a personas u objetos específicos. Un novedoso método de entrenamiento, denominado "pérdida de diversidad de atención", obliga al sistema a monitorear múltiples regiones visuales en cada cuadro, evitando que dependa excesivamente de los rostros.

Aunque aún está en desarrollo, UNITE podría convertirse pronto en una herramienta esencial para plataformas de redes sociales, redacciones y verificadores de hechos que buscan evitar que videos manipulados se vuelvan virales. A medida que los deepfakes amenazan cada vez más la confianza pública, los procesos democráticos y la integridad de la información, herramientas universales de detección como UNITE representan una línea de defensa crucial contra la desinformación digital.

Source:

Latest News