Google DeepMind a mis au point un nouveau système d’intelligence artificielle puissant qui pourrait révolutionner notre compréhension de la génétique humaine en déchiffrant ce que les scientifiques appelaient autrefois la « matière noire » de l’ADN.
AlphaGenome, lancé le 25 juin 2025, s’attaque à l’un des plus grands mystères de la biologie : comment les 98 % de notre génome qui ne codent pas directement pour des protéines influencent l’activité des gènes et les maladies. Alors que les modèles précédents ne pouvaient analyser que de petits segments d’ADN ou se concentraient sur des tâches uniques, AlphaGenome traite des séquences allant jusqu’à un million de paires de bases et prédit des milliers de propriétés moléculaires à la résolution d’une seule lettre.
« Pour la première fois, nous disposons d’un modèle unique qui unifie le contexte à longue portée, la précision au niveau de la base et des performances de pointe sur tout un spectre de tâches génomiques », explique le Dr Caleb Lareau du Memorial Sloan Kettering Cancer Center, qui a eu un accès anticipé à la technologie.
L’architecture du modèle combine des réseaux neuronaux convolutifs pour détecter les motifs locaux de séquences et des transformers pour modéliser les interactions à longue distance. Lors de tests rigoureux, AlphaGenome a surpassé les modèles spécialisés et généralistes dans 46 des 50 tests de référence, dont 24 sur 26 évaluations de la prédiction des effets des variantes.
L’une des capacités les plus remarquables d’AlphaGenome est la prédiction de l’épissage de l’ARN, un processus dont les erreurs peuvent provoquer des maladies génétiques rares comme l’amyotrophie spinale ou certaines formes de mucoviscidose. Le modèle peut également identifier comment des mutations dans les régions non codantes activent des gènes liés au cancer, comme le montre son analyse de la leucémie aiguë lymphoblastique à cellules T.
Bien qu’encore à un stade précoce et non validé pour un usage clinique, AlphaGenome est désormais disponible via une API pour la recherche non commerciale. Les scientifiques estiment qu’il pourrait accélérer la recherche médicale en aidant à identifier les mutations responsables de maladies, à guider la conception d’ADN synthétique et à approfondir notre compréhension fondamentale du fonctionnement du génome.
« Cet outil apportera une pièce cruciale au puzzle, nous permettant d’établir de meilleures connexions pour comprendre des maladies comme le cancer », déclare le professeur Marc Mansour de l’University College London. DeepMind prévoit de continuer à améliorer le modèle et de recueillir des retours pour répondre aux limites actuelles, comme la difficulté à prédire les interactions entre des régions d’ADN distantes de plus de 100 000 lettres.