Google DeepMind, le laboratoire de recherche en intelligence artificielle à l’origine du système AlphaFold — lauréat du prix Nobel pour la prédiction de la structure des protéines —, a mis au point un nouvel outil puissant s’attaquant à un défi encore plus complexe : déchiffrer les mystérieuses régions non codantes de l’ADN.
AlphaGenome, lancé en juin 2025, marque une avancée majeure dans la recherche génomique en prédisant comment les variantes génétiques affectent la régulation des gènes à travers l’ensemble du génome. Alors que seulement 2 % de l’ADN humain code directement pour des protéines, les 98 % restants — autrefois qualifiés d’« ADN poubelle » — jouent un rôle crucial dans le contrôle de l’activation et de la désactivation des gènes.
L’architecture du modèle combine des réseaux de neurones convolutifs, capables de détecter de courts motifs d’ADN, avec des modules de transformeurs qui saisissent les interactions à longue distance entre des éléments génomiques éloignés. Cette approche hybride permet à AlphaGenome de traiter des séquences allant jusqu’à un million de paires de bases tout en conservant une résolution à la lettre près — une nette amélioration par rapport aux modèles précédents, qui devaient sacrifier soit la longueur du contexte, soit la précision.
« Pour la première fois, nous avons créé un modèle unique qui unifie de nombreux défis liés à la compréhension du génome », a déclaré Pushmeet Kohli, vice-président de la recherche chez DeepMind. Le système a été entraîné sur des bases de données publiques issues de consortiums tels qu’ENCODE, GTEx et FANTOM5, qui ont mesuré expérimentalement les propriétés régulatrices dans des centaines de types cellulaires humains et murins.
AlphaGenome a déjà fait ses preuves dans des applications concrètes. Dans une étude préliminaire publiée en juin 2025, des chercheurs ont utilisé le modèle pour simuler avec précision la manière dont certaines mutations déclenchent la surexpression de gènes dans la leucémie aiguë lymphoblastique à cellules T, reproduisant ainsi des mécanismes pathologiques connus sans recourir à des expériences en laboratoire.
Cette technologie a des implications majeures pour la recherche sur les maladies, en permettant potentiellement aux scientifiques d’identifier les causes génétiques des pathologies en retraçant l’impact des mutations sur la régulation des gènes. Elle pourrait également accélérer la biologie synthétique en guidant la conception d’ADN doté de fonctions régulatrices spécifiques. DeepMind a mis AlphaGenome à disposition via une API pour la recherche non commerciale, et prévoit de publier le modèle complet à l’avenir.