Tekoälyn näkömallit epäonnistuvat kriittisessä negaatiotestissä lääketieteellisessä kuvantamisessa

MIT:n tutkijat ovat havainneet, että näkö-kielimallit, joita käytetään laajasti lääketieteellisten kuvien analysoinnissa, eivät ymmärrä negaatiosanoja kuten 'ei' ja 'ei ole'. Tämä merkittävä puute voi johtaa vakaviin diagnosointivirheisiin, kun näitä tekoälyjärjestelmiä käytetään lääketieteellisten kuvien hakemiseen tietyillä kriteereillä. Tutkimuksessa, joka julkaistiin 14. toukokuuta 2025, esitellään NegBench, uusi vertailutesti, jonka avulla voidaan arvioida ja parantaa tekoälyn negaation ymmärrystä kuvantamissovelluksissa.

MIT:n tutkijoiden uusi tutkimus on paljastanut perustavanlaatuisen puutteen näkö-kielimalleissa (VLM), mikä voi aiheuttaa vakavia seurauksia lääketieteellisessä diagnostiikassa ja muissa kriittisissä sovelluksissa.

Tutkimusryhmä, jota johti Kumail Alhamoud ja vanhempi kirjoittaja Marzyeh Ghassemi MIT:n sähkötekniikan ja tietojenkäsittelytieteen laitokselta, havaitsi, että nämä tekoälyjärjestelmät – joita käytetään yhä enemmän lääketieteellisten kuvien analysointiin – eivät ymmärrä negaatiosanoja kuten 'ei' ja 'ei ole' kyselyissä.

Tämä rajoite muodostuu erityisen ongelmalliseksi lääketieteellisissä yhteyksissä. Esimerkiksi, kun radiologi tarkastelee keuhkoröntgenkuvaa, jossa näkyy kudosturvotusta ilman suurentunutta sydäntä, tekoälyjärjestelmän käyttäminen vastaavien tapausten löytämiseen voi johtaa vääriin diagnooseihin, jos malli ei kykene erottamaan tiettyjen tilojen esiintymistä tai puuttumista.

"Negaatiolla voi olla erittäin merkittävä vaikutus, ja jos käytämme näitä malleja sokeasti, saatamme kohdata katastrofaalisia seurauksia", varoittaa tutkimuksen johtava kirjoittaja Alhamoud. Kun malleja testattiin niiden kyvyllä tunnistaa negaatio kuvateksteissä, ne suoriutuivat yhtä huonosti kuin satunnaisarvauksella.

Tämän ongelman ratkaisemiseksi tutkijat kehittivät NegBenchin, kattavan vertailutestin, joka sisältää 79 000 esimerkkiä 18 erilaisessa tehtävässä kattaen kuva-, video- ja lääketieteelliset aineistot. Vertailutesti arvioi kahta keskeistä kykyä: kuvien hakemista negaatiota sisältävillä kyselyillä sekä monivalintakysymyksiin vastaamista negaatiota sisältävien kuvatekstien perusteella.

Tutkimusryhmä loi myös negaatioon keskittyviä aineistoja mallien uudelleenkoulutusta varten, mikä paransi negaatiota sisältävien kyselyiden osumatarkkuutta 10 % ja monivalintakysymysten tarkkuutta 28 %. He kuitenkin korostavat, että ongelman perimmäisten syiden ratkaisemiseksi tarvitaan vielä lisää tutkimusta.

"Jos jokin näin perustavanlaatuinen asia kuin negaatio ei toimi, meidän ei pitäisi käyttää suuria näkö-/kielimalleja nykyisillä tavoilla ilman perusteellista arviointia", painottaa Ghassemi.

Tutkimus esitellään tulevassa Computer Vision and Pattern Recognition -konferenssissa, jossa korostetaan entistä kestävämpien tekoälyjärjestelmien kiireellistä tarvetta kriittisissä sovelluksissa, kuten terveydenhuollossa.

Source:

Tekoälyn näkömallit epäonnistuvat kriittisessä negaatiotestissä lääketieteellisessä kuvantamisessa

Latest News

ByteDancen Doubao AI tarjoaa nyt reaaliaikaista videoneuvonta-apua

OnePlus luopuu Alert Sliderista – tilalle tekoälyllä varustettu Plus Key -painike

Saksalaiset teknologiayritykset yhdistävät voimansa EU:n tukeman tekoälygigatehtaan puolesta

Yhdysvaltain syyttäjät tutkivat Builder.ai:ta ennen 1,5 miljardin dollarin tekoäly-startupin romahdusta

Norjan 1,8 biljoonan dollarin rahasto tekee tekoälystä pakollisen henkilöstölle

OpenTools.ai julkaisi tekoälyuutishubin teknologia-ammattilaisille

Google laajentaa tekoälypohjaista tietokoneen hallintaa kehittäjille Gemini-alustan kautta

Google parantaa Gemini-malleja läpinäkyvillä ajatusyhteenvedoilla

Tekoälyn näkömallit epäonnistuvat kriittisessä negaatiotestissä lääketieteellisessä kuvantamisessa

Related Articles

Anthropicin Claude 4 -mallit asettavat uuden standardin tekoälykoodauksessa

Analyytikot Pitävät CCC Intelligent Solutionsin Suosituksen 'Kohtuullisena Osta' -tasolla

NASA julkistaa rohkean tekoälystrategian seuraavan vuosikymmenen avaruustutkimukseen

OpenAI:n entinen tiedemies suunnitteli bunkkeria AGI:n jälkeistä maailmaa varten

Latest News

ByteDancen Doubao AI tarjoaa nyt reaaliaikaista videoneuvonta-apua

OnePlus luopuu Alert Sliderista – tilalle tekoälyllä varustettu Plus Key -painike

Saksalaiset teknologiayritykset yhdistävät voimansa EU:n tukeman tekoälygigatehtaan puolesta

Yhdysvaltain syyttäjät tutkivat Builder.ai:ta ennen 1,5 miljardin dollarin tekoäly-startupin romahdusta

Norjan 1,8 biljoonan dollarin rahasto tekee tekoälystä pakollisen henkilöstölle

OpenTools.ai julkaisi tekoälyuutishubin teknologia-ammattilaisille

Google laajentaa tekoälypohjaista tietokoneen hallintaa kehittäjille Gemini-alustan kautta

Google parantaa Gemini-malleja läpinäkyvillä ajatusyhteenvedoilla