Google DeepMind a lancé AlphaGenome, un système d’IA révolutionnaire qui déchiffre les mystérieuses régions non codantes de l’ADN humain, lesquelles influencent la régulation des gènes et le développement de maladies.
Contrairement aux modèles d’IA génomique précédents, qui se concentraient principalement sur les 2 % de l’ADN codant pour les protéines, AlphaGenome s’attaque aux 98 % restants — souvent appelés « matière noire » du génome — où résident de nombreuses variantes associées aux maladies. Le modèle peut traiter des séquences allant jusqu’à un million de paires de bases tout en maintenant une résolution au niveau du nucléotide, un exploit technique qui lui permet de saisir à la fois les motifs locaux et les relations régulatrices à distance.
« C’est une étape charnière pour le domaine », affirme le Dr Caleb Lareau du Memorial Sloan Kettering Cancer Center. « Pour la première fois, nous avons un modèle unique qui unifie le contexte à longue portée, la précision au niveau des bases et des performances de pointe sur tout un spectre de tâches génomiques. »
L’architecture hybride d’AlphaGenome combine des réseaux neuronaux convolutionnels pour détecter les motifs courts de l’ADN avec des modules transformeurs pour saisir les interactions à longue distance. Cette approche lui permet de prédire des milliers de propriétés moléculaires, incluant les niveaux d’expression des gènes, les schémas d’épissage de l’ARN, l’accessibilité de la chromatine, ainsi que la façon dont les mutations pourraient perturber ces processus. Lors de tests comparatifs, AlphaGenome a surpassé les modèles spécialisés dans 22 des 24 tâches de prédiction de séquences et dans 24 des 26 évaluations de prédiction des effets des variantes.
Le modèle a déjà démontré sa valeur pratique en recherche sur le cancer. Lors de l’analyse de mutations associées à la leucémie aiguë lymphoblastique à cellules T, AlphaGenome a correctement prédit comment certaines mutations non codantes activent un gène cancérigène en créant de nouveaux sites de liaison protéique — des résultats qui concordent avec les observations expérimentales.
Google rend AlphaGenome accessible via une API pour la recherche non commerciale, avec des plans pour un lancement complet ultérieur. Bien qu’il ne soit pas conçu ni validé pour des applications cliniques, les chercheurs estiment qu’il pourrait accélérer la compréhension des maladies en aidant à identifier les variantes génétiques causales et à orienter les efforts en biologie synthétique.
« Ce système nous rapproche d’une bonne première hypothèse sur ce que fera toute variante lorsqu’on l’observe chez l’humain », explique Lareau. Pushmeet Kohli, vice-président de la recherche chez DeepMind, décrit AlphaGenome comme « un grand premier pas » vers l’objectif ultime de simuler entièrement les processus cellulaires grâce à l’IA.