I et markant gennembrud for beregningsbiologi har Google DeepMind udviklet et kunstigt intelligenssystem, der kan dechifrere en af biologiens største gåder: hvordan de ikke-kodende områder af vores genom fungerer.
AlphaGenome, som blev præsenteret den 25. juni, markerer et betydeligt fremskridt inden for genomisk AI. Hvor tidligere modeller som AlphaFold fokuserede på proteinfoldning, tager AlphaGenome fat på en endnu mere kompleks udfordring – at tolke de 98 % af menneskets DNA, der tidligere blev afvist som 'junk', men som nu anerkendes som afgørende for at styre genaktivitet.
Modellens evner er uden fortilfælde. Den kan analysere DNA-sekvenser på op til én million basepar og forudsige tusindvis af molekylære egenskaber, herunder genekspressionsniveauer, RNA-splejsningsmønstre og virkningen af genetiske mutationer. For første gang kan forskere nu undersøge, hvordan DNA-varianter påvirker flere biologiske processer samtidigt med ét enkelt værktøj.
"Vi har for første gang skabt en samlet model, der forener mange af de forskellige udfordringer, der følger med at forstå genomet," siger Pushmeet Kohli, DeepMinds vicepræsident for forskning. Modellen overgik specialiserede systemer i 24 ud af 26 genomiske forudsigelsesbenchmarks.
Dr. Caleb Lareau, forsker ved Memorial Sloan Kettering Cancer Center, som havde tidlig adgang til AlphaGenome, kalder det 'en milepæl for feltet', der leverer 'langtrækkende kontekst, præcision på base-niveau og topmoderne ydeevne på tværs af hele spektret af genomiske opgaver.'
Selvom AlphaGenome stadig er i de tidlige faser, viser den særligt lovende resultater i forståelsen af genetiske sygdomme. Den kan forudsige, hvordan mutationer i ikke-kodende områder bidrager til sygdomme som kræft og sjældne lidelser ved at identificere, hvordan de forstyrrer genreguleringen. I et testtilfælde forudsagde modellen med succes, hvordan specifikke mutationer aktiverer et kræftrelateret gen ved leukæmi.
DeepMind har gjort AlphaGenome tilgængelig via API til ikke-kommerciel forskning og planlægger en fuld modeludgivelse i fremtiden. Virksomheden ser anvendelser, der spænder fra sygdomsforskning til design af syntetisk biologi, hvilket potentielt kan revolutionere genomisk medicin og fremskynde udviklingen af nye behandlinger.