Desetljećima su znanstvenici pokušavali shvatiti goleme dijelove ljudske DNK koji su nekoć bili odbačeni kao 'otpad'. Iako poznajemo cijeli slijed ljudskog genoma još od 2003. godine, funkcija 98% DNK koja izravno ne kodira proteine ostala je uglavnom nepoznata.
Novi AI model Google DeepMinda, AlphaGenome, predstavlja veliki korak prema rješenju ove zagonetke. Predstavljen 25. lipnja 2025., sustav može obrađivati DNK sekvence duge do milijun slova i predviđati tisuće molekularnih svojstava u različitim tkivima i vrstama stanica.
"Ovo je jedan od najtemeljnijih problema ne samo u biologiji — već u cijeloj znanosti", izjavio je Pushmeet Kohli, voditelj AI-ja za znanost u DeepMindu, tijekom predstavljanja. Model 'od sekvence do funkcije' uzima duge dijelove DNK i predviđa razna svojstva, uključujući razine ekspresije gena i kako bi ih mutacije mogle promijeniti.
Ono što AlphaGenome čini revolucionarnim jest njegova sposobnost analize nekodirajućih regija s dosad neviđenom točnošću. Prijašnji modeli morali su birati između duljine sekvence i razlučivosti, ali AlphaGenome postiže oboje, omogućujući predviđanja kroz 11 različitih modaliteta genske regulacije. Nadmašio je specijalizirane modele u 24 od 26 procjena učinka varijanti.
Model je već pokazao praktičnu primjenu. Kada je primijenjen na mutacije pronađene kod pacijenata s leukemijom, AlphaGenome je točno predvidio da nekodirajuće mutacije aktiviraju obližnji gen koji potiče razvoj raka. Ova sposobnost mogla bi transformirati pristup istraživanju genetskih bolesti.
"Dobijete popis varijanti gena, ali onda želim razumjeti koje od njih zapravo nešto rade i gdje mogu intervenirati", objasnio je Caleb Lareau, računalni biolog iz Memorial Sloan Kettering Cancer Center, koji je imao rani pristup sustavu. "Ovo nas približava dobrom prvom nagađanju o tome što će bilo koja varijanta raditi kad je uočimo kod čovjeka."
Iako je još uvijek u ranoj fazi, AlphaGenome je dostupan putem API-ja za nekomercijalna istraživanja. DeepMind planira u budućnosti objaviti sve detalje modela, što bi moglo omogućiti širu primjenu u genomici i razvoju terapija.