I årtier har forskere kæmpet for at forstå de enorme dele af menneskets DNA, der tidligere blev afvist som 'skrald'. Selvom vi har kendt den komplette menneskelige genomsekvens siden 2003, har funktionen af de 98 %, der ikke direkte koder for proteiner, forblevet stort set ukendt.
Google DeepMinds nye AI-model, AlphaGenome, udgør et vigtigt skridt mod at løse dette mysterium. Systemet, der blev lanceret den 25. juni 2025, kan behandle DNA-sekvenser på op til en million bogstaver og forudsige tusindvis af molekylære egenskaber på tværs af forskellige væv og celletyper.
"Dette er et af de mest grundlæggende problemer, ikke kun i biologi – men i hele videnskaben," sagde Pushmeet Kohli, leder af AI for videnskab hos DeepMind, under præsentationen. Modellen, der arbejder fra 'sekvens til funktion', tager lange DNA-strækninger og forudsiger forskellige egenskaber, herunder genekspressionsniveauer og hvordan mutationer kan påvirke dem.
Det, der gør AlphaGenome revolutionerende, er dens evne til at analysere ikke-kodende områder med hidtil uset nøjagtighed. Tidligere modeller måtte gå på kompromis mellem sekvenslængde og opløsning, men AlphaGenome opnår begge dele og kan forudsige på tværs af 11 forskellige modaliteter af genregulering. Den overgik specialiserede modeller i 24 ud af 26 evalueringer af variant-effekt forudsigelser.
Modellen har allerede vist praktiske anvendelser. Da AlphaGenome blev anvendt på mutationer fundet hos leukæmipatienter, forudsagde den præcist, at ikke-kodende mutationer aktiverede et nærliggende kræftfremkaldende gen. Denne evne kan ændre den måde, forskere tilgår genetiske sygdomme på.
"Du får denne liste over genvarianter, men jeg vil så forstå, hvilke af dem der faktisk gør noget, og hvor jeg kan gribe ind," forklarede Caleb Lareau, computergenetiker ved Memorial Sloan Kettering Cancer Center, som havde tidlig adgang til systemet. "Dette bringer os tættere på et godt første gæt på, hvad enhver variant vil gøre, når vi observerer den hos et menneske."
Selvom AlphaGenome stadig er i en tidlig fase, er modellen tilgængelig via API til ikke-kommerciel forskning. DeepMind planlægger at offentliggøre alle detaljer om modellen i fremtiden, hvilket potentielt kan muliggøre bredere anvendelser inden for genomisk medicin og udvikling af behandlinger.