menu
close

Το Σύστημα Τεχνητής Νοημοσύνης της Google Εντοπίζει Deepfakes Πέρα από τη Μόνο την Επεξεργασία Προσώπου

Ερευνητές του Πανεπιστημίου UC Riverside και της Google ανέπτυξαν το UNITE, ένα πρωτοποριακό σύστημα τεχνητής νοημοσύνης που εντοπίζει deepfakes ακόμη και όταν τα πρόσωπα δεν είναι ορατά στα βίντεο. Σε αντίθεση με τις παραδοσιακές μεθόδους ανίχνευσης, το UNITE αναλύει ολόκληρα τα καρέ του βίντεο, συμπεριλαμβανομένων των φόντων και των προτύπων κίνησης, για να εντοπίσει συνθετικό ή αλλοιωμένο περιεχόμενο. Αυτός ο καθολικός ανιχνευτής αποτελεί σημαντική πρόοδο στην αντιμετώπιση των ολοένα και πιο εξελιγμένων βίντεο που παράγονται με τεχνητή νοημοσύνη και απειλούν την ακεραιότητα της πληροφορίας.
Το Σύστημα Τεχνητής Νοημοσύνης της Google Εντοπίζει Deepfakes Πέρα από τη Μόνο την Επεξεργασία Προσώπου

Καθώς τα βίντεο που δημιουργούνται με τεχνητή νοημοσύνη γίνονται ολοένα και πιο πειστικά και εύκολα προσβάσιμα, ερευνητές του Πανεπιστημίου UC Riverside συνεργάστηκαν με τη Google για να αναπτύξουν ένα ισχυρό νέο όπλο κατά της ψηφιακής παραπλάνησης.

Το σύστημά τους, με την ονομασία Universal Network for Identifying Tampered and synthEtic videos (UNITE), αντιμετωπίζει μια κρίσιμη αδυναμία της τρέχουσας τεχνολογίας ανίχνευσης deepfake. Ενώ τα υπάρχοντα εργαλεία εστιάζουν κυρίως σε ανωμαλίες στα πρόσωπα, το UNITE εξετάζει ολόκληρα τα καρέ του βίντεο, συμπεριλαμβανομένων των φόντων, των προτύπων κίνησης και των λεπτών χωροχρονικών ασυνεπειών που αποκαλύπτουν την αλλοίωση.

«Τα deepfakes έχουν εξελιχθεί», εξηγεί ο Rohit Kundu, υποψήφιος διδάκτορας στο UC Riverside που ηγήθηκε της έρευνας. «Δεν αφορούν πλέον μόνο την ανταλλαγή προσώπων. Πλέον, δημιουργούνται εξ ολοκλήρου ψεύτικα βίντεο—από πρόσωπα μέχρι φόντα—με τη χρήση ισχυρών γενετικών μοντέλων. Το σύστημά μας έχει σχεδιαστεί για να εντοπίζει όλα αυτά.»

Η συνεργασία, στην οποία συμμετείχαν ο καθηγητής Amit Roy-Chowdhury και οι ερευνητές της Google Hao Xiong, Vishal Mohanty και Athula Balachandra, παρουσιάστηκε στο Συνέδριο Computer Vision and Pattern Recognition 2025 στο Νάσβιλ. Η καινοτομία τους έρχεται σε μια εποχή που οι πλατφόρμες δημιουργίας βίντεο από κείμενο ή εικόνα καθιστούν τις εξελιγμένες παραποιήσεις βίντεο προσβάσιμες σε σχεδόν οποιονδήποτε.

Το UNITE χρησιμοποιεί ένα μοντέλο βαθιάς μάθησης βασισμένο σε μετασχηματιστές (transformers), το οποίο στηρίζεται στο θεμέλιο που ονομάζεται SigLIP, εξάγοντας χαρακτηριστικά που δεν συνδέονται με συγκεκριμένα άτομα ή αντικείμενα. Μια νέα μέθοδος εκπαίδευσης, με την ονομασία «attention-diversity loss», αναγκάζει το σύστημα να παρακολουθεί πολλαπλές οπτικές περιοχές σε κάθε καρέ, αποτρέποντας την υπερβολική εξάρτηση από τα πρόσωπα.

Αν και βρίσκεται ακόμη υπό ανάπτυξη, το UNITE θα μπορούσε σύντομα να γίνει απαραίτητο για πλατφόρμες κοινωνικής δικτύωσης, αίθουσες σύνταξης και ελεγκτές γεγονότων που προσπαθούν να αποτρέψουν τη διάδοση παραποιημένων βίντεο. Καθώς τα deepfakes απειλούν ολοένα και περισσότερο τη δημόσια εμπιστοσύνη, τις δημοκρατικές διαδικασίες και την ακεραιότητα της πληροφορίας, καθολικά εργαλεία ανίχνευσης όπως το UNITE αποτελούν κρίσιμη γραμμή άμυνας ενάντια στην ψηφιακή παραπληροφόρηση.

Source:

Latest News