I årtionden har forskare kämpat för att förstå de stora delarna av människans DNA som en gång avfärdades som 'skräp'. Trots att vi känt till hela den mänskliga genomsekvensen sedan 2003 har funktionen hos de 98 % som inte direkt kodar för proteiner till stor del förblivit ett mysterium.
Google DeepMinds nya AI-modell, AlphaGenome, är ett stort steg mot att lösa denna gåta. Modellen lanserades den 25 juni 2025 och kan bearbeta DNA-sekvenser upp till en miljon bokstäver långa samt förutsäga tusentals molekylära egenskaper över olika vävnader och celltyper.
"Det här är ett av de mest grundläggande problemen, inte bara inom biologin – utan i hela vetenskapen," sade Pushmeet Kohli, chef för AI inom vetenskap på DeepMind, vid tillkännagivandet. Modellen, som går från sekvens till funktion, tar långa DNA-sträckor och förutspår olika egenskaper, inklusive genuttrycksnivåer och hur mutationer kan påverka dessa.
Det som gör AlphaGenome revolutionerande är dess förmåga att analysera icke-kodande regioner med en aldrig tidigare skådad noggrannhet. Tidigare modeller tvingades kompromissa mellan sekvenslängd och upplösning, men AlphaGenome klarar båda, vilket gör det möjligt att förutsäga över 11 olika modaliteter av genreglering. Modellen överträffade specialiserade modeller i 24 av 26 utvärderingar av förutsägelse av varianters effekt.
Modellen har redan visat praktiska tillämpningar. När AlphaGenome användes på mutationer som hittats hos leukemipatienter kunde den korrekt förutsäga att icke-kodande mutationer aktiverade en närliggande cancerdrivande gen. Denna förmåga kan förändra hur forskare närmar sig genetiska sjukdomar.
"Du får en lista över genvarianter, men sedan vill jag förstå vilka av dessa som faktiskt gör något, och var jag kan ingripa," förklarade Caleb Lareau, beräkningsbiolog vid Memorial Sloan Kettering Cancer Center, som fick tidig tillgång till systemet. "Detta för oss närmare en bra första gissning om vad vilken variant som helst gör när vi observerar den hos en människa."
Även om AlphaGenome fortfarande är i ett tidigt skede är modellen tillgänglig via API för icke-kommersiell forskning. DeepMind planerar att släppa fullständiga detaljer om modellen i framtiden, vilket potentiellt kan möjliggöra bredare tillämpningar inom genomisk medicin och utveckling av nya behandlingar.