Google DeepMind a mis au point un nouveau système d’IA puissant qui pourrait révolutionner notre compréhension de la génétique humaine en déchiffrant ce que les scientifiques appelaient autrefois la « matière noire » de l’ADN.
AlphaGenome, lancé le 25 juin 2025, s’attaque à l’un des plus grands mystères de la biologie : comment les 98 % de notre génome qui ne codent pas directement pour des protéines influencent l’activité des gènes et les maladies. Alors que les modèles précédents ne pouvaient analyser que de petits segments d’ADN ou se concentraient sur des tâches uniques, AlphaGenome traite des séquences allant jusqu’à un million de paires de bases et prédit des milliers de propriétés moléculaires à la résolution d’une seule lettre.
« Pour la première fois, nous avons un modèle unique qui unifie le contexte à longue portée, la précision au niveau de la base et une performance de pointe sur tout un éventail de tâches génomiques », a déclaré le Dr Caleb Lareau du Memorial Sloan Kettering Cancer Center, qui a eu un accès précoce à la technologie.
L’architecture du modèle combine des réseaux neuronaux convolutifs pour détecter les motifs locaux dans les séquences et des transformeurs pour modéliser les interactions à longue distance. Lors de tests rigoureux, AlphaGenome a surpassé les modèles spécialisés et généralistes dans 46 des 50 tests de référence, dont 24 des 26 évaluations de la prédiction des effets des variantes.
L’une des capacités les plus importantes d’AlphaGenome est de prédire l’épissage de l’ARN — un processus où des erreurs peuvent causer des maladies génétiques rares comme l’amyotrophie spinale ou certaines formes de fibrose kystique. Le modèle peut également identifier comment des mutations dans les régions non codantes activent des gènes liés au cancer, comme démontré dans son analyse de la leucémie aiguë lymphoblastique à cellules T.
Bien qu’il soit encore à ses débuts et non validé pour un usage clinique, AlphaGenome est désormais accessible via une API pour la recherche non commerciale. Les scientifiques estiment qu’il pourrait accélérer la recherche médicale en aidant à identifier les mutations responsables de maladies, à guider la conception d’ADN synthétique et à approfondir notre compréhension fondamentale du fonctionnement du génome.
« Cet outil fournira une pièce essentielle du casse-tête, nous permettant de mieux faire les liens pour comprendre des maladies comme le cancer », a déclaré le professeur Marc Mansour de l’University College London. DeepMind prévoit de continuer à améliorer le modèle et à recueillir des commentaires pour surmonter les limites actuelles, comme la difficulté à prédire les interactions entre des régions d’ADN espacées de plus de 100 000 lettres.