I ett stort genombrott för beräkningsbiologin har Google DeepMind utvecklat ett artificiellt intelligenssystem som kan lösa en av biologins största gåtor: hur de icke-kodande regionerna i vårt genom fungerar.
AlphaGenome, som presenterades den 25 juni, innebär ett betydande framsteg för AI inom genomik. Medan tidigare modeller som AlphaFold fokuserade på proteinveckning, tar AlphaGenome sig an en ännu mer komplex utmaning – att tolka de 98 % av människans DNA som tidigare avfärdades som 'skräp', men som nu anses vara avgörande för att styra genaktivitet.
Modellens kapacitet är oöverträffad. Den kan analysera DNA-sekvenser på upp till en miljon baspar och förutsäga tusentals molekylära egenskaper, inklusive genuttrycksnivåer, mönster för RNA-splitsning och effekten av genetiska mutationer. För första gången kan forskare samtidigt undersöka hur DNA-varianter påverkar flera biologiska processer med ett enda verktyg.
"Vi har, för första gången, skapat en enhetlig modell som samlar många av de olika utmaningar som finns i förståelsen av genomet," säger Pushmeet Kohli, DeepMinds forskningschef. Modellen överträffade specialiserade system i 24 av 26 genomiska prediktionsjämförelser.
Dr. Caleb Lareau, forskare vid Memorial Sloan Kettering Cancer Center som fick tidig tillgång till AlphaGenome, kallar det "en milstolpe för området" som erbjuder "långdistanssammanhang, precision på basnivå och topprestanda över hela spektrumet av genomiska uppgifter."
Även om AlphaGenome fortfarande befinner sig i ett tidigt skede, visar modellen särskilt stor potential för att förstå genetiska sjukdomar. Den kan förutsäga hur mutationer i icke-kodande regioner bidrar till tillstånd som cancer och sällsynta sjukdomar, genom att identifiera hur de stör genregleringen. I ett testfall lyckades modellen förutsäga hur specifika mutationer aktiverar en cancerrelaterad gen vid leukemi.
DeepMind har gjort AlphaGenome tillgänglig via API för icke-kommersiell forskning, med planer på att släppa hela modellen i framtiden. Företaget ser användningsområden som sträcker sig från sjukdomsforskning till design av syntetisk biologi, med potential att revolutionera genomisk medicin och påskynda utvecklingen av nya behandlingar.