I et markant fremskridt for beregningsbiologien har Google DeepMind introduceret AlphaGenome, et kunstig intelligens-system designet til at afkode mysterierne i ikke-kodende DNA – ofte kaldet genomets 'mørke materie'.
Selvom forskere afsluttede Human Genome Project i 2003 og kortlagde vores komplette genetiske kode, har forståelsen af, hvad størstedelen af dette DNA faktisk gør, været en af biologiens største udfordringer. Kun omkring 2 % af menneskets DNA koder direkte for proteiner, mens de resterende 98 % spiller afgørende regulerende roller, som hidtil har været svære at fortolke.
AlphaGenome markerer et stort skridt i retning af at løse denne udfordring. Modellen kan analysere ekstremt lange DNA-sekvenser – op til en million basepar – og forudsige tusindvis af molekylære egenskaber med hidtil uset præcision. Det inkluderer, hvor gener starter og slutter i forskellige væv, hvordan RNA splejses, mængden af produceret RNA, og hvilke proteiner der binder til specifikke DNA-områder.
"Vi har for første gang skabt en samlet model, der forener mange af de forskellige udfordringer, der følger med forståelsen af genomet," siger Pushmeet Kohli, forskningsdirektør hos DeepMind. Systemet overgik specialiserede modeller i 22 ud af 24 sekvensforudsigelsesbenchmarks og matchede eller overgik andre i 24 ud af 26 opgaver for forudsigelse af variant-effekter.
I modsætning til tidligere genomiske AI-modeller, der fokuserede på specifikke opgaver eller kun protein-kodende områder, tilbyder AlphaGenome en helhedsorienteret tilgang til fortolkning af hele genomet. Anshul Kundaje, beregningsgenomiker ved Stanford University, som fik tidlig adgang til systemet, kalder det "en reel forbedring i forhold til stort set alle nuværende førende sekvens-til-funktion-modeller."
Potentialet for anvendelser er vidtrækkende. AlphaGenome kan hjælpe forskere med mere præcist at identificere årsager til sygdomme, vejlede design af syntetisk DNA med specifikke regulerende funktioner og fremskynde vores forståelse af genetiske sygdomme. I en demonstration forudsagde modellen med succes, hvordan specifikke mutationer aktiverer et kræftrelateret gen ved leukæmi ved at skabe et nyt proteinbindingssted – og genskabte dermed en kendt sygdomsmekanisme.
AlphaGenome er nu tilgængelig via API til ikke-kommerciel forskning, og DeepMind planlægger at offentliggøre alle modeldetaljer senere. Virksomheden understreger, at systemet repræsenterer et væsentligt gennembrud, men at det ikke er designet eller valideret til personlig genomforudsigelse eller klinisk brug.