Τα Μοντέλα Όρασης Τεχνητής Νοημοσύνης Αποτυγχάνουν σε Κρίσιμο Τεστ Άρνησης στην Ιατρική Απεικόνιση

Ερευνητές του MIT ανακάλυψαν ότι τα μοντέλα όρασης-γλώσσας, που χρησιμοποιούνται ευρέως στην ανάλυση ιατρικών εικόνων, δεν μπορούν να κατανοήσουν λέξεις άρνησης όπως «όχι» και «μην». Αυτός ο κρίσιμος περιορισμός θα μπορούσε να οδηγήσει σε σοβαρά διαγνωστικά λάθη όταν αυτά τα συστήματα τεχνητής νοημοσύνης καλούνται να ανακτήσουν ιατρικές εικόνες με συγκεκριμένα κριτήρια. Η μελέτη, που δημοσιεύθηκε στις 14 Μαΐου 2025, παρουσιάζει το NegBench, ένα νέο σημείο αναφοράς για την αξιολόγηση και βελτίωση της κατανόησης της άρνησης στα συστήματα όρασης τεχνητής νοημοσύνης.

Μια νέα μελέτη από ερευνητές του MIT αποκάλυψε ένα θεμελιώδες ελάττωμα στα μοντέλα όρασης-γλώσσας (VLMs), το οποίο θα μπορούσε να έχει σοβαρές επιπτώσεις στη διαγνωστική ιατρική και σε άλλες κρίσιμες εφαρμογές.

Η ερευνητική ομάδα, με επικεφαλής τον Kumail Alhamoud και την ανώτερη συγγραφέα Marzyeh Ghassemi από το Τμήμα Ηλεκτρολόγων Μηχανικών και Επιστήμης Υπολογιστών του MIT, διαπίστωσε ότι αυτά τα συστήματα τεχνητής νοημοσύνης—τα οποία χρησιμοποιούνται ολοένα και περισσότερο για την ανάλυση ιατρικών εικόνων—αποτυγχάνουν να κατανοήσουν λέξεις άρνησης όπως «όχι» και «μην» σε ερωτήματα.

Αυτός ο περιορισμός γίνεται ιδιαίτερα προβληματικός σε ιατρικά πλαίσια. Για παράδειγμα, όταν ένας ακτινολόγος εξετάζει μια ακτινογραφία θώρακα που δείχνει οίδημα ιστών χωρίς διόγκωση καρδιάς, η χρήση ενός συστήματος τεχνητής νοημοσύνης για την εύρεση παρόμοιων περιπτώσεων μπορεί να οδηγήσει σε λανθασμένες διαγνώσεις αν το μοντέλο δεν μπορεί να διακρίνει την παρουσία ή απουσία συγκεκριμένων καταστάσεων.

«Αυτές οι λέξεις άρνησης μπορούν να έχουν πολύ σημαντικό αντίκτυπο, και αν χρησιμοποιούμε αυτά τα μοντέλα χωρίς κριτική, μπορεί να οδηγηθούμε σε καταστροφικές συνέπειες», προειδοποιεί ο κύριος συγγραφέας Alhamoud. Όταν τα μοντέλα δοκιμάστηκαν στην ικανότητά τους να εντοπίζουν άρνηση σε λεζάντες εικόνων, οι επιδόσεις τους δεν ήταν καλύτερες από μια τυχαία επιλογή.

Για την αντιμετώπιση αυτού του προβλήματος, οι ερευνητές ανέπτυξαν το NegBench, ένα ολοκληρωμένο σημείο αναφοράς με 79.000 παραδείγματα σε 18 παραλλαγές εργασιών που καλύπτουν σύνολα δεδομένων εικόνων, βίντεο και ιατρικών δεδομένων. Το σημείο αναφοράς αξιολογεί δύο βασικές ικανότητες: την ανάκτηση εικόνων βάσει ερωτημάτων με άρνηση και την απάντηση σε ερωτήσεις πολλαπλής επιλογής με λεζάντες που περιέχουν άρνηση.

Η ομάδα δημιούργησε επίσης σύνολα δεδομένων με παραδείγματα ειδικά για άρνηση, ώστε να επαναεκπαιδεύσει τα μοντέλα, επιτυγχάνοντας βελτίωση 10% στην ανάκληση για ερωτήματα με άρνηση και αύξηση 28% στην ακρίβεια σε ερωτήσεις πολλαπλής επιλογής με λεζάντες άρνησης. Ωστόσο, προειδοποιούν ότι απαιτείται περαιτέρω εργασία για να αντιμετωπιστούν οι βαθύτερες αιτίες του προβλήματος.

«Αν κάτι τόσο θεμελιώδες όσο η άρνηση δεν λειτουργεί σωστά, δεν θα έπρεπε να χρησιμοποιούμε μεγάλα μοντέλα όρασης/γλώσσας με τον τρόπο που τα χρησιμοποιούμε σήμερα—χωρίς εντατική αξιολόγηση», τονίζει η Ghassemi.

Η έρευνα θα παρουσιαστεί στο επερχόμενο Συνέδριο για την Όραση Υπολογιστών και την Αναγνώριση Προτύπων, υπογραμμίζοντας την επείγουσα ανάγκη για πιο αξιόπιστα συστήματα τεχνητής νοημοσύνης σε κρίσιμες εφαρμογές όπως η υγειονομική περίθαλψη.

Source:

Τα Μοντέλα Όρασης Τεχνητής Νοημοσύνης Αποτυγχάνουν σε Κρίσιμο Τεστ Άρνησης στην Ιατρική Απεικόνιση

Latest News

Η Doubao AI της ByteDance Προσφέρει Πλέον Βοήθεια σε Πραγματικό Χρόνο Μέσω Βίντεο

Η OnePlus Αντικαθιστά το Alert Slider με το AI-Powered Plus Key

Οι Γερμανικοί Τεχνολογικοί Κολοσσοί Ενώνουν Δυνάμεις για Ευρωπαϊκή Γιγα-Βιομηχανία Τεχνητής Νοημοσύνης με Υποστήριξη της ΕΕ

Οι Αμερικανοί Εισαγγελείς Εξέτασαν την Builder.ai Πριν την Κατάρρευση της Startup Τεχνητής Νοημοσύνης $1,5 Δισ.

Το Ταμείο των 1,8 Τρισεκατομμυρίων Δολαρίων της Νορβηγίας Καθιστά την Τεχνητή Νοημοσύνη Υποχρεωτική για το Προσωπικό

Το OpenTools.ai Παρουσιάζει Κόμβο Ειδήσεων Τεχνητής Νοημοσύνης για Επαγγελματίες Τεχνολογίας

Η Google Επεκτείνει τον Έλεγχο Υπολογιστών με Τεχνητή Νοημοσύνη στους Προγραμματιστές μέσω του Gemini

Η Google Ενισχύει τα Μοντέλα Gemini με Διαφανείς Περιλήψεις Σκέψης

Τα Μοντέλα Όρασης Τεχνητής Νοημοσύνης Αποτυγχάνουν σε Κρίσιμο Τεστ Άρνησης στην Ιατρική Απεικόνιση

Related Articles

Τα Μοντέλα Claude 4 της Anthropic Θέτουν Νέα Πρότυπα στην Κωδικοποίηση Τεχνητής Νοημοσύνης

Οι Αναλυτές Διατηρούν τη Βαθμολογία «Μέτρια Αγορά» για την CCC Intelligent Solutions

Η NASA Αποκαλύπτει Τολμηρή Στρατηγική Τεχνητής Νοημοσύνης για τη Νέα Δεκαετία Εξερεύνησης του Διαστήματος

Πρώην Επιστήμονας της OpenAI Σχεδίαζε Καταφύγιο για τον Μετα-AGI Κόσμο

Latest News

Η Doubao AI της ByteDance Προσφέρει Πλέον Βοήθεια σε Πραγματικό Χρόνο Μέσω Βίντεο

Η OnePlus Αντικαθιστά το Alert Slider με το AI-Powered Plus Key

Οι Γερμανικοί Τεχνολογικοί Κολοσσοί Ενώνουν Δυνάμεις για Ευρωπαϊκή Γιγα-Βιομηχανία Τεχνητής Νοημοσύνης με Υποστήριξη της ΕΕ

Οι Αμερικανοί Εισαγγελείς Εξέτασαν την Builder.ai Πριν την Κατάρρευση της Startup Τεχνητής Νοημοσύνης $1,5 Δισ.

Το Ταμείο των 1,8 Τρισεκατομμυρίων Δολαρίων της Νορβηγίας Καθιστά την Τεχνητή Νοημοσύνη Υποχρεωτική για το Προσωπικό

Το OpenTools.ai Παρουσιάζει Κόμβο Ειδήσεων Τεχνητής Νοημοσύνης για Επαγγελματίες Τεχνολογίας

Η Google Επεκτείνει τον Έλεγχο Υπολογιστών με Τεχνητή Νοημοσύνη στους Προγραμματιστές μέσω του Gemini

Η Google Ενισχύει τα Μοντέλα Gemini με Διαφανείς Περιλήψεις Σκέψης