Depuis des décennies, les scientifiques tentent de percer le mystère des 98 % de l’ADN humain qui ne codent pas directement pour des protéines — souvent appelés la « matière noire » du génome. Le 25 juin 2025, Google DeepMind a présenté une solution potentielle : AlphaGenome, un système d’intelligence artificielle conçu pour interpréter cet ADN non codant mystérieux.
Contrairement aux modèles précédents, qui ne pouvaient analyser que de courts segments d’ADN ou manquaient de précision à l’échelle d’une seule base, AlphaGenome peut traiter des séquences allant jusqu’à un million de lettres tout en conservant une résolution au niveau du nucléotide. Cette avancée technique permet aux chercheurs d’examiner comment des éléments régulateurs éloignés influencent l’activité des gènes — un facteur crucial pour comprendre les mécanismes des maladies.
« C’est l’un des problèmes les plus fondamentaux, non seulement en biologie, mais dans toute la science », a déclaré Pushmeet Kohli, responsable de l’IA pour la science chez DeepMind. Le modèle prédit des milliers de propriétés moléculaires, dont l’emplacement des débuts et fins de gènes dans différents tissus, la façon dont l’ARN est épissé et quelles protéines se lient à des régions précises de l’ADN.
Lors de tests comparatifs, AlphaGenome a surpassé des outils spécialisés dans 22 des 24 tâches de prédiction de séquences et a égalé ou dépassé d’autres modèles dans 24 des 26 évaluations d’effets de variantes. En analysant des mutations trouvées chez des patients atteints de leucémie, le modèle a prédit avec précision comment des variantes non codantes activaient le gène TAL1 lié au cancer en créant un nouveau site de liaison pour la protéine MYB — reproduisant un mécanisme de maladie déjà confirmé en laboratoire.
« Pour la première fois, nous avons un modèle unique qui unifie le contexte à longue portée, la précision à l’échelle de la base et des performances de pointe sur tout un éventail de tâches génomiques », a affirmé le Dr Caleb Lareau du Memorial Sloan Kettering Cancer Center, qui a eu un accès précoce au système.
Malgré sa puissance, AlphaGenome présente certaines limites. Il a de la difficulté avec les éléments régulateurs extrêmement éloignés (à plus de 100 000 paires de bases) et ne peut pas prédire des résultats de santé ou des traits personnels. DeepMind rend le modèle accessible via une API pour la recherche non commerciale, avec l’intention de le rendre entièrement disponible ultérieurement. Les chercheurs s’attendent à ce qu’il accélère les études sur les maladies en permettant des expériences virtuelles qui nécessitaient auparavant de longs travaux en laboratoire.