Καθώς τα βίντεο που δημιουργούνται με τεχνητή νοημοσύνη γίνονται ολοένα και πιο πειστικά και εύκολα προσβάσιμα, ερευνητές του Πανεπιστημίου UC Riverside συνεργάστηκαν με τη Google για να αναπτύξουν ένα ισχυρό νέο όπλο κατά της ψηφιακής παραπλάνησης.
Το σύστημά τους, με την ονομασία Universal Network for Identifying Tampered and synthEtic videos (UNITE), αντιμετωπίζει μια κρίσιμη αδυναμία της τρέχουσας τεχνολογίας ανίχνευσης deepfake. Ενώ τα υπάρχοντα εργαλεία εστιάζουν κυρίως σε ανωμαλίες στα πρόσωπα, το UNITE εξετάζει ολόκληρα τα καρέ του βίντεο, συμπεριλαμβανομένων των φόντων, των προτύπων κίνησης και των λεπτών χωροχρονικών ασυνεπειών που αποκαλύπτουν την αλλοίωση.
«Τα deepfakes έχουν εξελιχθεί», εξηγεί ο Rohit Kundu, υποψήφιος διδάκτορας στο UC Riverside που ηγήθηκε της έρευνας. «Δεν αφορούν πλέον μόνο την ανταλλαγή προσώπων. Πλέον, δημιουργούνται εξ ολοκλήρου ψεύτικα βίντεο—από πρόσωπα μέχρι φόντα—με τη χρήση ισχυρών γενετικών μοντέλων. Το σύστημά μας έχει σχεδιαστεί για να εντοπίζει όλα αυτά.»
Η συνεργασία, στην οποία συμμετείχαν ο καθηγητής Amit Roy-Chowdhury και οι ερευνητές της Google Hao Xiong, Vishal Mohanty και Athula Balachandra, παρουσιάστηκε στο Συνέδριο Computer Vision and Pattern Recognition 2025 στο Νάσβιλ. Η καινοτομία τους έρχεται σε μια εποχή που οι πλατφόρμες δημιουργίας βίντεο από κείμενο ή εικόνα καθιστούν τις εξελιγμένες παραποιήσεις βίντεο προσβάσιμες σε σχεδόν οποιονδήποτε.
Το UNITE χρησιμοποιεί ένα μοντέλο βαθιάς μάθησης βασισμένο σε μετασχηματιστές (transformers), το οποίο στηρίζεται στο θεμέλιο που ονομάζεται SigLIP, εξάγοντας χαρακτηριστικά που δεν συνδέονται με συγκεκριμένα άτομα ή αντικείμενα. Μια νέα μέθοδος εκπαίδευσης, με την ονομασία «attention-diversity loss», αναγκάζει το σύστημα να παρακολουθεί πολλαπλές οπτικές περιοχές σε κάθε καρέ, αποτρέποντας την υπερβολική εξάρτηση από τα πρόσωπα.
Αν και βρίσκεται ακόμη υπό ανάπτυξη, το UNITE θα μπορούσε σύντομα να γίνει απαραίτητο για πλατφόρμες κοινωνικής δικτύωσης, αίθουσες σύνταξης και ελεγκτές γεγονότων που προσπαθούν να αποτρέψουν τη διάδοση παραποιημένων βίντεο. Καθώς τα deepfakes απειλούν ολοένα και περισσότερο τη δημόσια εμπιστοσύνη, τις δημοκρατικές διαδικασίες και την ακεραιότητα της πληροφορίας, καθολικά εργαλεία ανίχνευσης όπως το UNITE αποτελούν κρίσιμη γραμμή άμυνας ενάντια στην ψηφιακή παραπληροφόρηση.