Google DeepMind a lancé AlphaGenome, un système d’intelligence artificielle révolutionnaire qui déchiffre les mystérieuses régions non codantes de l’ADN humain, lesquelles influencent la régulation des gènes et le développement des maladies.
Contrairement aux précédents modèles d’IA génomique, qui se concentraient principalement sur les 2 % de l’ADN codant pour les protéines, AlphaGenome s’attaque aux 98 % restants — souvent qualifiés de « matière noire » du génome — où résident de nombreuses variantes associées aux maladies. Le modèle peut traiter des séquences allant jusqu’à un million de paires de bases tout en conservant une résolution au niveau du nucléotide, un exploit technique qui lui permet de saisir à la fois les motifs locaux et les relations régulatrices à distance.
« C’est une étape majeure pour le domaine », déclare le Dr Caleb Lareau du Memorial Sloan Kettering Cancer Center. « Pour la première fois, nous disposons d’un modèle unique qui unifie le contexte à longue portée, la précision au niveau de la base et des performances de pointe sur tout un spectre de tâches génomiques. »
L’architecture hybride d’AlphaGenome combine des réseaux de neurones convolutionnels pour détecter les motifs courts de l’ADN et des modules de type transformeur pour capturer les interactions à longue distance. Cette approche lui permet de prédire des milliers de propriétés moléculaires, notamment les niveaux d’expression génique, les schémas d’épissage de l’ARN, l’accessibilité de la chromatine, ainsi que la manière dont les mutations pourraient perturber ces processus. Lors de tests comparatifs, AlphaGenome a surpassé les modèles spécialisés dans 22 des 24 tâches de prédiction de séquences et dans 24 des 26 évaluations de prédiction des effets des variantes.
Le modèle a déjà démontré sa valeur pratique en recherche sur le cancer. Lors de l’analyse de mutations associées à la leucémie aiguë lymphoblastique à cellules T, AlphaGenome a correctement prédit comment certaines mutations non codantes activent un gène cancérigène en créant de nouveaux sites de liaison protéique — des résultats conformes aux observations expérimentales.
Google met AlphaGenome à disposition via une API pour la recherche non commerciale, avec des projets de diffusion complète à l’avenir. Bien qu’il ne soit pas conçu ni validé pour des applications cliniques, les chercheurs estiment qu’il pourrait accélérer la compréhension des maladies en aidant à identifier les variantes génétiques causales et à orienter les efforts en biologie synthétique.
« Ce système nous rapproche d’une bonne première estimation de ce que fera toute variante lorsqu’on l’observe chez l’humain », explique Lareau. Pushmeet Kohli, vice-président de la recherche chez DeepMind, décrit AlphaGenome comme « une grande première étape » vers l’objectif ultime de simuler entièrement les processus cellulaires grâce à l’IA.