Modelos de Visão por IA Falham Teste Crítico de Negação em Imagiologia Médica

Investigadores do MIT descobriram que modelos de visão-linguagem, amplamente utilizados na análise de imagens médicas, não conseguem compreender palavras de negação como 'não' e 'nem'. Esta limitação crítica pode originar erros graves de diagnóstico quando estes sistemas de IA são utilizados para recuperar imagens médicas com critérios específicos. O estudo, publicado a 14 de maio de 2025, apresenta o NegBench, um novo benchmark para avaliar e melhorar a compreensão da negação em sistemas de visão por IA.

Um novo estudo realizado por investigadores do MIT revelou uma falha fundamental em modelos de visão-linguagem (VLMs) que pode ter sérias implicações para diagnósticos médicos e outras aplicações críticas.

A equipa de investigação, liderada por Kumail Alhamoud e pela autora sénior Marzyeh Ghassemi do Departamento de Engenharia Eletrotécnica e Ciência da Computação do MIT, descobriu que estes sistemas de IA — cada vez mais usados para analisar imagens médicas — não conseguem compreender palavras de negação como 'não' e 'nem' nas consultas.

Esta limitação torna-se especialmente problemática em contextos médicos. Por exemplo, quando um radiologista examina uma radiografia torácica que mostra inchaço dos tecidos sem aumento do coração, utilizar um sistema de IA para encontrar casos semelhantes pode conduzir a diagnósticos incorretos se o modelo não conseguir distinguir entre a presença e a ausência de determinadas condições.

"Essas palavras de negação podem ter um impacto muito significativo e, se utilizarmos estes modelos de forma cega, podemos enfrentar consequências catastróficas", alerta o autor principal Alhamoud. Quando testados na sua capacidade de identificar negação em legendas de imagens, os modelos não apresentaram melhores resultados do que uma escolha aleatória.

Para abordar este problema, os investigadores desenvolveram o NegBench, um benchmark abrangente com 79.000 exemplos distribuídos por 18 variações de tarefas, abrangendo conjuntos de dados de imagens, vídeo e medicina. O benchmark avalia duas capacidades essenciais: a recuperação de imagens com base em consultas negadas e a resposta a perguntas de escolha múltipla com legendas negadas.

A equipa também criou conjuntos de dados com exemplos específicos de negação para re-treinar estes modelos, conseguindo uma melhoria de 10% na recuperação de consultas negadas e um aumento de 28% na precisão em perguntas de escolha múltipla com legendas negadas. No entanto, alertam que é necessário mais trabalho para resolver as causas profundas deste problema.

"Se algo tão fundamental como a negação está comprometido, não deveríamos estar a utilizar modelos de visão/linguagem de grande escala da forma como o fazemos atualmente — sem uma avaliação intensiva", enfatiza Ghassemi.

A investigação será apresentada na próxima Conferência sobre Visão Computacional e Reconhecimento de Padrões, destacando a necessidade urgente de sistemas de IA mais robustos em aplicações críticas como a saúde.

Source:

Modelos de Visão por IA Falham Teste Crítico de Negação em Imagiologia Médica

Latest News

Doubao AI da ByteDance Agora Oferece Assistência em Vídeo em Tempo Real

OnePlus Substitui o Alert Slider pelo Novo Botão Personalizável Plus Key com IA

Gigantes Tecnológicos Alemães Unem-se para Gigafábrica de IA Apoiada pela UE

Procuradores dos EUA Investigaram a Builder.ai Antes do Colapso da Startup de IA Avaliada em $1,5 Mil Milhões

Fundo de 1,8 biliões de dólares da Noruega torna a IA obrigatória para os colaboradores

OpenTools.ai Lança Hub de Notícias de IA para Profissionais de Tecnologia

Google Expande o Controlo de Computadores por IA aos Programadores através do Gemini

Google Melhora Modelos Gemini com Resumos Transparentes do Processo de Pensamento

Modelos de Visão por IA Falham Teste Crítico de Negação em Imagiologia Médica

Related Articles

Modelos Claude 4 da Anthropic Estabelecem Novo Referencial em Programação de IA

Analistas Mantêm Recomendação de 'Compra Moderada' para a CCC Intelligent Solutions

NASA Revela Estratégia Audaz de IA para a Próxima Década de Exploração Espacial

Ex-Cientista da OpenAI Planeou Bunker para um Mundo Pós-AGI

Latest News

Doubao AI da ByteDance Agora Oferece Assistência em Vídeo em Tempo Real

OnePlus Substitui o Alert Slider pelo Novo Botão Personalizável Plus Key com IA

Gigantes Tecnológicos Alemães Unem-se para Gigafábrica de IA Apoiada pela UE

Procuradores dos EUA Investigaram a Builder.ai Antes do Colapso da Startup de IA Avaliada em $1,5 Mil Milhões

Fundo de 1,8 biliões de dólares da Noruega torna a IA obrigatória para os colaboradores

OpenTools.ai Lança Hub de Notícias de IA para Profissionais de Tecnologia

Google Expande o Controlo de Computadores por IA aos Programadores através do Gemini

Google Melhora Modelos Gemini com Resumos Transparentes do Processo de Pensamento