Sa loob ng mga dekada, nahirapan ang mga siyentista na maintindihan ang layunin ng 98% ng human DNA na hindi direktang gumagawa ng protina—na kadalasang tinatawag na genomic 'dark matter.' Noong Hunyo 25, 2025, inilunsad ng Google DeepMind ang isang posibleng solusyon: ang AlphaGenome, isang artificial intelligence system na idinisenyo upang bigyang-kahulugan ang mahiwagang non-coding DNA na ito.
Hindi tulad ng mga naunang modelo na kayang suriin lamang ang maiikling bahagi ng DNA o walang kakayahang mag-analisa sa antas ng isang base, kayang iproseso ng AlphaGenome ang mga sequence na hanggang isang milyong letra ang haba habang pinananatili ang katumpakan sa bawat nucleotide. Ang teknikal na tagumpay na ito ay nagbibigay-daan sa mga mananaliksik na pag-aralan kung paano naaapektuhan ng malalayong regulatory element ang aktibidad ng gene—isang mahalagang aspeto sa pag-unawa ng mga mekanismo ng sakit.
"Isa ito sa mga pinaka-pundamental na problema hindi lang sa biology—kundi sa buong agham," ayon kay Pushmeet Kohli, pinuno ng AI for Science ng DeepMind. Hinuhulaan ng modelo ang libu-libong katangiang molekular, kabilang kung saan nagsisimula at nagtatapos ang mga gene sa iba’t ibang tissue, paano na-splice ang RNA, at aling mga protina ang kumakabit sa partikular na bahagi ng DNA.
Sa mga benchmark test, nalampasan ng AlphaGenome ang mga specialized na tool sa 22 sa 24 na sequence prediction task at tumabla o lumampas pa sa iba sa 24 sa 26 na variant-effect evaluation. Sa pagsusuri ng mga mutation na natagpuan sa mga pasyenteng may leukemia, tama nitong nahulaan kung paano pinapagana ng mga non-coding variant ang cancer-related na TAL1 gene sa pamamagitan ng paglikha ng bagong binding site para sa MYB protein—isang kilalang mekanismo ng sakit na dati nang napatunayan sa laboratoryo.
"Sa unang pagkakataon, mayroon tayong iisang modelo na pinagsasama ang long-range context, base-level precision, at state-of-the-art na performance sa buong hanay ng mga genomic task," ayon kay Dr. Caleb Lareau ng Memorial Sloan Kettering Cancer Center, isa sa mga unang nakagamit ng sistema.
Bagamat makapangyarihan, may mga limitasyon pa rin ang AlphaGenome. Nahihirapan ito sa mga regulatory element na napakalayo (higit sa 100,000 base pair ang layo) at hindi nito kayang hulaan ang personal na kalusugan o mga katangian ng isang tao. Ginagawang available ng DeepMind ang modelo sa pamamagitan ng API para sa mga non-commercial na pananaliksik, at may plano para sa mas malawak na pagpapalabas nito sa hinaharap. Inaasahan ng mga mananaliksik na mapapabilis nito ang mga pag-aaral tungkol sa sakit sa pamamagitan ng mga virtual na eksperimento na dati ay nangangailangan ng matinding laboratoryo.