MIT:n tutkijoiden uusi tutkimus on paljastanut perustavanlaatuisen puutteen näkö-kielimalleissa (VLM), mikä voi aiheuttaa vakavia seurauksia lääketieteellisessä diagnostiikassa ja muissa kriittisissä sovelluksissa.
Tutkimusryhmä, jota johti Kumail Alhamoud ja vanhempi kirjoittaja Marzyeh Ghassemi MIT:n sähkötekniikan ja tietojenkäsittelytieteen laitokselta, havaitsi, että nämä tekoälyjärjestelmät – joita käytetään yhä enemmän lääketieteellisten kuvien analysointiin – eivät ymmärrä negaatiosanoja kuten 'ei' ja 'ei ole' kyselyissä.
Tämä rajoite muodostuu erityisen ongelmalliseksi lääketieteellisissä yhteyksissä. Esimerkiksi, kun radiologi tarkastelee keuhkoröntgenkuvaa, jossa näkyy kudosturvotusta ilman suurentunutta sydäntä, tekoälyjärjestelmän käyttäminen vastaavien tapausten löytämiseen voi johtaa vääriin diagnooseihin, jos malli ei kykene erottamaan tiettyjen tilojen esiintymistä tai puuttumista.
"Negaatiolla voi olla erittäin merkittävä vaikutus, ja jos käytämme näitä malleja sokeasti, saatamme kohdata katastrofaalisia seurauksia", varoittaa tutkimuksen johtava kirjoittaja Alhamoud. Kun malleja testattiin niiden kyvyllä tunnistaa negaatio kuvateksteissä, ne suoriutuivat yhtä huonosti kuin satunnaisarvauksella.
Tämän ongelman ratkaisemiseksi tutkijat kehittivät NegBenchin, kattavan vertailutestin, joka sisältää 79 000 esimerkkiä 18 erilaisessa tehtävässä kattaen kuva-, video- ja lääketieteelliset aineistot. Vertailutesti arvioi kahta keskeistä kykyä: kuvien hakemista negaatiota sisältävillä kyselyillä sekä monivalintakysymyksiin vastaamista negaatiota sisältävien kuvatekstien perusteella.
Tutkimusryhmä loi myös negaatioon keskittyviä aineistoja mallien uudelleenkoulutusta varten, mikä paransi negaatiota sisältävien kyselyiden osumatarkkuutta 10 % ja monivalintakysymysten tarkkuutta 28 %. He kuitenkin korostavat, että ongelman perimmäisten syiden ratkaisemiseksi tarvitaan vielä lisää tutkimusta.
"Jos jokin näin perustavanlaatuinen asia kuin negaatio ei toimi, meidän ei pitäisi käyttää suuria näkö-/kielimalleja nykyisillä tavoilla ilman perusteellista arviointia", painottaa Ghassemi.
Tutkimus esitellään tulevassa Computer Vision and Pattern Recognition -konferenssissa, jossa korostetaan entistä kestävämpien tekoälyjärjestelmien kiireellistä tarvetta kriittisissä sovelluksissa, kuten terveydenhuollossa.