Mit der zunehmenden Überzeugungskraft und Verfügbarkeit KI-generierter Videos haben sich Forschende der UC Riverside mit Google zusammengeschlossen, um eine wirkungsvolle neue Waffe gegen digitale Täuschung zu entwickeln.
Ihr System, genannt Universal Network for Identifying Tampered and synthEtic videos (UNITE), adressiert eine kritische Schwachstelle aktueller Deepfake-Erkennungstechnologien. Während bestehende Werkzeuge sich vor allem auf Auffälligkeiten im Gesicht konzentrieren, untersucht UNITE komplette Videoframes – einschließlich Hintergründen, Bewegungsmustern und subtilen raum-zeitlichen Unstimmigkeiten, die auf Manipulationen hinweisen.
„Deepfakes haben sich weiterentwickelt“, erklärt Rohit Kundu, Doktorand an der UC Riverside und Leiter der Forschungsarbeit. „Es geht längst nicht mehr nur um Gesichtstausch. Mittlerweile werden ganze Videos – von Gesichtern bis zu Hintergründen – mithilfe leistungsfähiger generativer Modelle künstlich erzeugt. Unser System ist darauf ausgelegt, all das zu erkennen.“
Die Zusammenarbeit, an der auch Professor Amit Roy-Chowdhury sowie die Google-Forschenden Hao Xiong, Vishal Mohanty und Athula Balachandra beteiligt waren, wurde auf der Conference on Computer Vision and Pattern Recognition 2025 in Nashville vorgestellt. Die Innovation kommt zu einem Zeitpunkt, an dem Text-zu-Video- und Bild-zu-Video-Generierungsplattformen ausgefeilte Video-Fälschungen für praktisch jedermann zugänglich machen.
UNITE nutzt ein transformer-basiertes Deep-Learning-Modell, das auf einer Grundlage namens SigLIP aufbaut. Dieses extrahiert Merkmale, die nicht an bestimmte Personen oder Objekte gebunden sind. Ein neuartiges Trainingsverfahren, das als „Attention-Diversity Loss“ bezeichnet wird, zwingt das System dazu, mehrere visuelle Bereiche in jedem Frame zu überwachen und verhindert so eine Überbetonung von Gesichtern.
Obwohl sich UNITE noch in der Entwicklung befindet, könnte das System schon bald für soziale Netzwerke, Redaktionen und Faktenprüfer unverzichtbar werden, um die Verbreitung manipulierter Videos zu verhindern. Da Deepfakes zunehmend das öffentliche Vertrauen, demokratische Prozesse und die Integrität von Informationen bedrohen, stellen universelle Erkennungstools wie UNITE eine entscheidende Verteidigungslinie gegen digitale Desinformation dar.