Google DeepMind ha lanciato AlphaGenome, un sistema di intelligenza artificiale rivoluzionario che decifra le misteriose regioni non codificanti del DNA umano, influenzando la regolazione genica e lo sviluppo delle malattie.
A differenza dei precedenti modelli genomici di IA, focalizzati principalmente sul 2% del DNA che codifica per le proteine, AlphaGenome affronta il restante 98% – spesso definito 'materia oscura genomica' – dove risiedono molte varianti associate alle malattie. Il modello è in grado di processare sequenze lunghe fino a un milione di paia di basi mantenendo una risoluzione a livello di singolo nucleotide, una conquista tecnica che consente di catturare sia i pattern locali sia le relazioni regolatorie a distanza.
"È una pietra miliare per il settore", afferma il dottor Caleb Lareau del Memorial Sloan Kettering Cancer Center. "Per la prima volta, disponiamo di un unico modello che unifica il contesto a lungo raggio, la precisione a livello di base e prestazioni all’avanguardia su un intero spettro di compiti genomici."
L’architettura ibrida di AlphaGenome combina reti neurali convoluzionali, per rilevare pattern brevi nel DNA, con moduli transformer, per catturare interazioni a lungo raggio. Questo approccio consente di prevedere migliaia di proprietà molecolari, tra cui i livelli di espressione genica, i pattern di splicing dell’RNA, l’accessibilità della cromatina e come le mutazioni possano alterare questi processi. Nei test di benchmarking, AlphaGenome ha superato modelli specializzati in 22 su 24 compiti di previsione di sequenze e in 24 su 26 valutazioni di previsione degli effetti delle varianti.
Il modello ha già dimostrato valore pratico nella ricerca oncologica. Analizzando mutazioni associate alla leucemia linfoblastica acuta a cellule T, AlphaGenome ha previsto correttamente come specifiche mutazioni non codificanti attivino un gene oncogeno creando nuovi siti di legame per le proteine – in linea con i risultati sperimentali.
Google sta rendendo AlphaGenome disponibile tramite API per la ricerca non commerciale, con piani per un rilascio completo in futuro. Pur non essendo progettato né validato per applicazioni cliniche, i ricercatori ritengono che possa accelerare la comprensione delle malattie aiutando a identificare le varianti genetiche causali e guidare gli sforzi di biologia sintetica.
"Questo sistema ci avvicina a una buona prima ipotesi su cosa farà qualsiasi variante quando la osserviamo in un essere umano", spiega Lareau. Il vicepresidente della ricerca di DeepMind, Pushmeet Kohli, descrive AlphaGenome come "un grande primo passo" verso l’obiettivo finale di simulare completamente i processi cellulari tramite l’intelligenza artificiale.