Google DeepMind, le laboratoire de recherche en intelligence artificielle à l’origine du système AlphaFold — reconnu par le prix Nobel pour la prédiction de la structure des protéines — a développé un nouvel outil puissant qui s’attaque à un défi encore plus complexe : déchiffrer les mystérieuses régions non codantes de l’ADN.
AlphaGenome, lancé en juin 2025, marque une percée majeure en recherche génomique en prédisant comment les variantes génétiques affectent la régulation des gènes à travers l’ensemble du génome. Alors que seulement 2 % de l’ADN humain code directement pour des protéines, les 98 % restants — autrefois qualifiés de « déchets » — jouent un rôle crucial dans le contrôle de l’activation et de l’expression des gènes.
L’architecture du modèle combine des réseaux neuronaux convolutionnels, qui détectent les motifs courts de l’ADN, avec des modules transformeurs capables de saisir les interactions à longue distance entre des éléments génomiques éloignés. Cette approche hybride permet à AlphaGenome de traiter des séquences allant jusqu’à un million de paires de bases tout en conservant une résolution à la lettre près — une amélioration significative par rapport aux modèles précédents qui devaient sacrifier soit la longueur du contexte, soit la précision.
« Pour la première fois, nous avons créé un modèle unique qui unifie de nombreux défis liés à la compréhension du génome », explique Pushmeet Kohli, vice-président à la recherche chez DeepMind. Le système a été entraîné à partir de bases de données publiques issues de consortiums tels qu’ENCODE, GTEx et FANTOM5, qui ont mesuré expérimentalement les propriétés régulatrices dans des centaines de types cellulaires humains et murins.
AlphaGenome a déjà démontré ses capacités dans des applications concrètes. Dans une étude préliminaire publiée en juin 2025, des chercheurs ont utilisé le modèle pour simuler avec précision comment certaines mutations déclenchent la surexpression de gènes dans la leucémie aiguë lymphoblastique à cellules T, reproduisant des mécanismes pathologiques connus sans recourir à des expériences en laboratoire.
Cette technologie a des implications majeures pour la recherche sur les maladies, en aidant potentiellement les scientifiques à identifier les origines génétiques de divers troubles en retraçant l’impact des mutations sur la régulation des gènes. Elle pourrait aussi accélérer la biologie synthétique en guidant la conception d’ADN doté de fonctions régulatrices spécifiques. DeepMind a rendu AlphaGenome accessible via une API pour la recherche non commerciale et prévoit de publier le modèle complet ultérieurement.