Per decenni, gli scienziati hanno cercato di comprendere lo scopo del 98% del DNA umano che non codifica direttamente per le proteine—spesso definito la "materia oscura" del genoma. Il 25 giugno 2025, Google DeepMind ha presentato una possibile soluzione: AlphaGenome, un sistema di intelligenza artificiale progettato per interpretare questo misterioso DNA non codificante.
A differenza dei modelli precedenti, che potevano analizzare solo brevi segmenti di DNA o mancavano di precisione a livello di singola base, AlphaGenome è in grado di processare sequenze fino a un milione di lettere mantenendo una risoluzione a livello nucleotidico. Questa innovazione tecnica permette ai ricercatori di esaminare come elementi regolatori distanti influenzino l’attività genica—un fattore cruciale per comprendere i meccanismi delle malattie.
"Questo è uno dei problemi più fondamentali non solo della biologia, ma di tutta la scienza", ha dichiarato Pushmeet Kohli, responsabile dell’IA per la scienza di DeepMind. Il modello prevede migliaia di proprietà molecolari, tra cui dove iniziano e finiscono i geni nei diversi tessuti, come avviene lo splicing dell’RNA e quali proteine si legano a specifiche regioni del DNA.
Nei test di riferimento, AlphaGenome ha superato strumenti specializzati in 22 su 24 compiti di previsione di sequenze e ha eguagliato o superato altri modelli in 24 su 26 valutazioni dell’effetto delle varianti. Analizzando mutazioni riscontrate in pazienti affetti da leucemia, il modello ha previsto con precisione come le varianti non codificanti attivassero il gene TAL1 correlato al cancro creando un nuovo sito di legame per la proteina MYB—replicando un meccanismo patologico noto, precedentemente confermato solo tramite studi di laboratorio.
"Per la prima volta, abbiamo un unico modello che unifica il contesto a lungo raggio, la precisione a livello di base e prestazioni all’avanguardia su tutto lo spettro dei compiti genomici", ha affermato il dottor Caleb Lareau del Memorial Sloan Kettering Cancer Center, che ha avuto accesso anticipato al sistema.
Nonostante la sua potenza, AlphaGenome presenta delle limitazioni. Fatica con elementi regolatori estremamente distanti (oltre 100.000 paia di basi) e non può prevedere esiti o caratteristiche personali di salute. DeepMind sta rendendo il modello disponibile tramite API per la ricerca non commerciale, con piani per un rilascio completo in futuro. I ricercatori si aspettano che accelererà gli studi sulle malattie consentendo esperimenti virtuali che prima richiedevano un ampio lavoro di laboratorio.