Dans une percée majeure pour la biologie computationnelle, Google DeepMind a lancé AlphaGenome, un système d’intelligence artificielle conçu pour décoder les mystérieuses régions non codantes qui composent 98 % de l’ADN humain.
Alors que seulement 2 % de notre génome code directement pour des protéines, la « matière noire » restante joue un rôle crucial dans la régulation de l’activité des gènes et est souvent impliquée dans les maladies. AlphaGenome représente le premier modèle d’IA complet capable d’analyser ces régions régulatrices complexes à une échelle et une résolution sans précédent.
« C’est l’un des problèmes les plus fondamentaux, non seulement en biologie, mais dans toute la science », a déclaré Pushmeet Kohli, responsable de l’IA pour la science chez DeepMind, lors d’un point de presse. Le modèle s’appuie sur le succès précédent de DeepMind avec AlphaFold, qui a révolutionné la prédiction de la structure des protéines et a partagé le prix Nobel de chimie l’an dernier.
Les capacités techniques d’AlphaGenome sont impressionnantes. Il peut traiter des séquences d’ADN allant jusqu’à un million de paires de bases tout en conservant une résolution au niveau du nucléotide, ce qui lui permet de prédire des milliers de propriétés moléculaires caractérisant la régulation des gènes. Lors de tests comparatifs, il a surpassé des modèles spécialisés dans 22 des 24 tâches de prédiction de séquences et a égalé ou dépassé d’autres modèles dans 24 des 26 évaluations de prédiction d’effet de variantes.
Le modèle a déjà démontré des applications concrètes en recherche sur les maladies. Lors de l’analyse de mutations retrouvées chez des patients atteints de leucémie, AlphaGenome a prédit avec précision comment des variantes non codantes activaient un gène cancérigène en créant un nouveau site de liaison pour une protéine régulatrice. « Déterminer la pertinence des différentes variantes non codantes peut être extrêmement difficile, surtout à grande échelle. Cet outil fournit une pièce cruciale du casse-tête », a expliqué le professeur Marc Mansour de l’University College London.
DeepMind a rendu AlphaGenome accessible via une API pour la recherche non commerciale, avec des plans pour un déploiement complet à l’avenir. Bien que le modèle ait certaines limites — il a de la difficulté avec les interactions d’ADN très distantes et n’est pas validé pour un usage clinique — il représente un pas important vers la compréhension du fonctionnement de notre génome et pourrait accélérer les découvertes en recherche sur les maladies, en biologie synthétique et en médecine personnalisée.