Isang mahalagang tagumpay para sa computational biology ang ipinakilala ng Google DeepMind: ang AlphaGenome, isang artificial intelligence system na idinisenyo upang lutasin ang mga misteryo ng non-coding DNA—na kadalasang tinatawag na "dark matter" ng genome.
Bagamat natapos ng mga siyentipiko ang Human Genome Project noong 2003 at nailahad ang kumpletong genetic blueprint ng tao, nanatiling isa sa pinakamalalaking hamon ng biyolohiya ang pag-unawa kung ano ang ginagawa ng karamihan sa ating DNA. Tinatayang 2% lamang ng human DNA ang direktang gumagawa ng protina, habang ang natitirang 98% ay may mahahalagang regulatoryong papel na mahirap ipaliwanag.
Isang malaking hakbang pasulong ang AlphaGenome sa pagsagot sa hamong ito. Kayang suriin ng model ang napakahahabang DNA sequence—hanggang isang milyong base-pair—at hulaan ang libu-libong katangian ng molekula nang may walang kapantay na katumpakan. Kabilang dito kung saan nagsisimula at nagtatapos ang mga gene sa iba't ibang tissue, paano hinahati-hati ang RNA (splicing), gaano karaming RNA ang nalilikha, at aling mga protina ang kumakabit sa partikular na bahagi ng DNA.
"Sa unang pagkakataon, nakalikha kami ng isang modelong nagkakaisa sa maraming hamon ng pag-unawa sa genome," pahayag ni Pushmeet Kohli, bise presidente para sa pananaliksik sa DeepMind. Natalo ng system ang mga espesyalisadong modelo sa 22 sa 24 na sequence prediction benchmarks at pumantay o humigit pa sa iba sa 24 sa 26 na variant-effect prediction tasks.
Hindi tulad ng mga naunang AI model para sa genome na nakatuon lamang sa partikular na gawain o sa protein-coding na bahagi, nag-aalok ang AlphaGenome ng komprehensibong paraan ng interpretasyon sa buong genome. Ayon kay Anshul Kundaje, computational genomicist mula sa Stanford University na unang nakagamit ng system, ito ay "isang tunay na pagbuti sa halos lahat ng kasalukuyang pinakamahusay na sequence-to-function models."
Malawak ang potensyal na aplikasyon nito. Maaaring tulungan ng AlphaGenome ang mga mananaliksik na matukoy nang mas eksakto ang sanhi ng mga sakit, gabayan ang disenyo ng synthetic DNA na may partikular na regulatoryong tungkulin, at pabilisin ang ating pag-unawa sa mga genetic na karamdaman. Sa isang demonstrasyon, matagumpay na nahulaan ng model kung paano pinapagana ng mga partikular na mutasyon ang isang cancer-related gene sa leukemia sa pamamagitan ng paglikha ng bagong protein binding site—isang mekanismong kilala sa sakit.
Maaari nang gamitin ang AlphaGenome sa pamamagitan ng API para sa hindi-komersyal na pananaliksik, at balak ng DeepMind na ilabas ang buong detalye ng modelo sa hinaharap. Binibigyang-diin ng kumpanya na bagamat isang makabuluhang tagumpay ang system, hindi ito idinisenyo o napatunayan para sa personal genome prediction o klinikal na paggamit.