Num avanço significativo para a biologia computacional, a Google DeepMind apresentou o AlphaGenome, um sistema de inteligência artificial concebido para decifrar os mistérios do ADN não codificante — frequentemente apelidado de "matéria negra" do genoma.
Apesar de os cientistas terem concluído o Projeto Genoma Humano em 2003, revelando o nosso plano genético completo, compreender a função da maior parte deste ADN tem permanecido como um dos maiores desafios da biologia. Apenas cerca de 2% do ADN humano codifica diretamente proteínas, enquanto os restantes 98% desempenham papéis reguladores cruciais, mas de difícil interpretação.
O AlphaGenome representa um avanço importante na abordagem deste desafio. O modelo consegue analisar sequências de ADN extremamente longas — até um milhão de pares de bases — e prever milhares de propriedades moleculares com uma precisão sem precedentes. Entre estas incluem-se a identificação dos pontos de início e fim dos genes em diferentes tecidos, o modo como o ARN é processado (splicing), a quantidade de ARN produzida e as proteínas que se ligam a regiões específicas do ADN.
"Pela primeira vez, criámos um modelo único que unifica muitos dos diferentes desafios associados à compreensão do genoma", afirmou Pushmeet Kohli, vice-presidente de investigação na DeepMind. O sistema superou modelos especializados em 22 dos 24 testes de previsão de sequências e igualou ou ultrapassou outros em 24 dos 26 testes de previsão de efeitos de variantes.
Ao contrário de modelos anteriores de IA genómica, que se focavam em tarefas específicas ou apenas nas regiões codificantes de proteínas, o AlphaGenome oferece uma abordagem abrangente à interpretação de todo o genoma. Anshul Kundaje, especialista em genómica computacional da Universidade de Stanford que teve acesso antecipado ao sistema, classificou-o como "uma melhoria genuína em praticamente todos os modelos atuais de previsão de função a partir da sequência".
As potenciais aplicações são vastas. O AlphaGenome poderá ajudar investigadores a identificar com maior precisão as causas de doenças, orientar o design de ADN sintético com funções reguladoras específicas e acelerar a nossa compreensão das doenças genéticas. Numa demonstração, o modelo previu com sucesso como mutações específicas ativam um gene relacionado com o cancro na leucemia, criando um novo local de ligação proteica e replicando um mecanismo de doença já conhecido.
O AlphaGenome está agora disponível via API para investigação não comercial, estando a DeepMind a planear divulgar todos os detalhes do modelo no futuro. A empresa sublinha que, apesar de o sistema representar um avanço significativo, não foi concebido nem validado para previsão do genoma pessoal ou utilização clínica.