Por décadas, cientistas vêm tentando entender as vastas porções do DNA humano antes descartadas como "lixo". Embora a sequência completa do genoma humano seja conhecida desde 2003, a função dos 98% que não codificam proteínas diretamente permaneceu em grande parte um mistério.
O novo modelo de IA do Google DeepMind, AlphaGenome, representa um grande passo para desvendar esse enigma. Lançado em 25 de junho de 2025, o sistema é capaz de processar sequências de DNA com até um milhão de letras e prever milhares de propriedades moleculares em diferentes tecidos e tipos celulares.
"Este é um dos problemas mais fundamentais não só da biologia — mas de toda a ciência", afirmou Pushmeet Kohli, chefe de IA para ciência da DeepMind, durante o anúncio. O modelo "sequência para função" recebe longos trechos de DNA e prevê diversas propriedades, incluindo níveis de expressão gênica e como mutações podem afetá-los.
O que torna o AlphaGenome revolucionário é sua capacidade de analisar regiões não codificantes com precisão sem precedentes. Modelos anteriores precisavam escolher entre comprimento da sequência e resolução, mas o AlphaGenome alcança ambos, permitindo previsões em 11 diferentes modalidades de regulação gênica. Ele superou modelos especializados em 24 das 26 avaliações de previsão de efeitos de variantes.
O modelo já demonstrou aplicações práticas. Ao ser aplicado a mutações encontradas em pacientes com leucemia, o AlphaGenome previu com precisão que mutações em regiões não codificantes ativaram um gene próximo responsável pelo câncer. Essa capacidade pode transformar a abordagem dos pesquisadores em relação a doenças genéticas.
"Você recebe uma lista de variantes gênicas, mas eu quero entender quais delas realmente têm efeito e onde posso intervir", explicou Caleb Lareau, biólogo computacional do Memorial Sloan Kettering Cancer Center, que teve acesso antecipado ao sistema. "Isso nos aproxima de um bom palpite inicial sobre o que qualquer variante fará quando a observamos em um humano."
Embora ainda esteja em estágios iniciais, o AlphaGenome já está disponível via API para pesquisas não comerciais. O DeepMind planeja divulgar todos os detalhes do modelo no futuro, o que pode viabilizar aplicações mais amplas em medicina genômica e desenvolvimento de terapias.