Em um avanço significativo para a biologia computacional, o Google DeepMind apresentou o AlphaGenome, um sistema de inteligência artificial projetado para decifrar os mistérios do DNA não codificante — frequentemente chamado de "matéria escura" do genoma.
Embora os cientistas tenham concluído o Projeto Genoma Humano em 2003, revelando nosso mapa genético completo, entender o real papel da maior parte desse DNA continua sendo um dos maiores desafios da biologia. Apenas cerca de 2% do DNA humano codifica proteínas diretamente, enquanto os 98% restantes desempenham funções regulatórias cruciais que têm sido difíceis de interpretar.
O AlphaGenome representa um grande avanço nesse desafio. O modelo é capaz de analisar sequências de DNA extremamente longas — até um milhão de pares de bases — e prever milhares de propriedades moleculares com precisão inédita. Entre elas estão a identificação do início e fim de genes em diferentes tecidos, o modo como o RNA é processado (splicing), a quantidade de RNA produzida e quais proteínas se ligam a regiões específicas do DNA.
"Pela primeira vez, criamos um único modelo que unifica muitos dos diferentes desafios relacionados à compreensão do genoma", disse Pushmeet Kohli, vice-presidente de pesquisa do DeepMind. O sistema superou modelos especializados em 22 dos 24 testes de predição de sequência e igualou ou superou outros em 24 de 26 tarefas de predição de efeitos de variantes.
Diferentemente de modelos anteriores de IA genômica, que focavam em tarefas específicas ou apenas nas regiões codificadoras de proteínas, o AlphaGenome oferece uma abordagem abrangente para interpretar todo o genoma. O genomicista computacional da Universidade de Stanford, Anshul Kundaje, que teve acesso antecipado ao sistema, classificou-o como "uma melhoria genuína em praticamente todos os modelos atuais de sequência para função".
As aplicações potenciais são vastas. O AlphaGenome pode ajudar pesquisadores a identificar causas de doenças com mais precisão, orientar o design de DNA sintético com funções regulatórias específicas e acelerar a compreensão de doenças genéticas. Em uma demonstração, o modelo previu com sucesso como mutações específicas ativam um gene relacionado ao câncer em leucemia, criando um novo sítio de ligação de proteína e replicando um mecanismo de doença já conhecido.
O AlphaGenome já está disponível via API para pesquisas não comerciais, e o DeepMind planeja divulgar detalhes completos do modelo futuramente. A empresa enfatiza que, apesar de representar um avanço significativo, o sistema não foi projetado nem validado para predição genômica pessoal ou uso clínico.