In un importante progresso per la biologia computazionale, Google DeepMind ha introdotto AlphaGenome, un sistema di intelligenza artificiale progettato per decifrare i misteri del DNA non codificante—spesso definito la "materia oscura" del genoma.
Sebbene il Progetto Genoma Umano sia stato completato nel 2003, rivelando il nostro intero patrimonio genetico, comprendere la funzione della maggior parte di questo DNA è rimasto una delle sfide più grandi della biologia. Solo circa il 2% del DNA umano codifica direttamente per le proteine, mentre il restante 98% svolge ruoli regolatori cruciali che sono stati difficili da interpretare.
AlphaGenome rappresenta un passo avanti significativo nell’affrontare questa sfida. Il modello può analizzare sequenze di DNA estremamente lunghe—fino a un milione di paia di basi—e prevedere migliaia di proprietà molecolari con una precisione senza precedenti. Tra queste: la localizzazione dei geni nei diversi tessuti, il modo in cui l’RNA viene processato (splicing), la quantità di RNA prodotta e quali proteine si legano a specifiche regioni del DNA.
"Per la prima volta abbiamo creato un modello unico che unifica molte delle diverse sfide legate alla comprensione del genoma", ha dichiarato Pushmeet Kohli, vicepresidente della ricerca presso DeepMind. Il sistema ha superato i modelli specializzati in 22 dei 24 benchmark di predizione di sequenze e ha eguagliato o superato gli altri in 24 delle 26 prove di predizione degli effetti delle varianti.
A differenza dei precedenti modelli di IA genomica, che si concentravano su compiti specifici o solo sulle regioni codificanti per proteine, AlphaGenome offre un approccio completo all’interpretazione dell’intero genoma. Anshul Kundaje, genomista computazionale della Stanford University che ha avuto accesso anticipato al sistema, lo ha definito "un reale miglioramento rispetto a praticamente tutti i modelli attuali di sequenza-funzione all’avanguardia".
Le potenziali applicazioni sono vaste. AlphaGenome potrebbe aiutare i ricercatori a individuare con maggiore precisione le cause delle malattie, guidare la progettazione di DNA sintetico con funzioni regolatorie specifiche e accelerare la comprensione delle malattie genetiche. In una dimostrazione, il modello ha previsto con successo come specifiche mutazioni attivino un gene correlato al cancro nella leucemia creando un nuovo sito di legame per una proteina, replicando un noto meccanismo patologico.
AlphaGenome è ora disponibile tramite API per la ricerca non commerciale, e DeepMind prevede di rilasciare in futuro i dettagli completi del modello. L’azienda sottolinea che, sebbene il sistema rappresenti un progresso significativo, non è stato progettato né validato per la predizione genomica personale o per l’uso clinico.