Google DeepMind har lanserat AlphaGenome, ett revolutionerande AI-system som avkodar de mystiska icke-kodande regionerna av människans DNA som påverkar genreglering och sjukdomsutveckling.
Till skillnad från tidigare genomiska AI-modeller som främst fokuserat på de 2 % av DNA:t som kodar för proteiner, tar AlphaGenome sig an de återstående 98 % – ofta kallade genomets 'mörka materia' – där många sjukdomsassocierade varianter finns. Modellen kan bearbeta sekvenser på upp till en miljon baspar samtidigt som den bibehåller upplösning på enskild nukleotidnivå, en teknisk bedrift som gör det möjligt att fånga både lokala mönster och avlägsna reglerande samband.
"Det är en milstolpe för fältet," säger Dr. Caleb Lareau vid Memorial Sloan Kettering Cancer Center. "För första gången har vi en enda modell som förenar långväga kontext, basnivåprecision och topprestanda över hela spektrumet av genomiska uppgifter."
AlphaGenomes hybridarkitektur kombinerar konvolutionella neurala nätverk för att upptäcka korta DNA-mönster med transformer-moduler som fångar långväga interaktioner. Detta tillvägagångssätt gör det möjligt för modellen att förutsäga tusentals molekylära egenskaper, inklusive genuttrycksnivåer, RNA-splitsningsmönster, kromatinåtkomlighet och hur mutationer kan störa dessa processer. I jämförelsetester överträffade AlphaGenome specialiserade modeller i 22 av 24 sekvensprediktionsuppgifter och 24 av 26 utvärderingar av variantpåverkan.
Modellen har redan visat praktisk nytta inom cancerforskning. Vid analys av mutationer kopplade till T-cells akut lymfatisk leukemi förutsåg AlphaGenome korrekt hur specifika icke-kodande mutationer aktiverar en cancerdrivande gen genom att skapa nya proteinbindningsställen – i linje med experimentella fynd.
Google gör AlphaGenome tillgänglig via ett API för icke-kommersiell forskning, med planer på en fullständig lansering i framtiden. Även om modellen inte är avsedd eller validerad för kliniska tillämpningar tror forskare att den kan påskynda förståelsen av sjukdomar genom att hjälpa till att identifiera orsakande genetiska varianter och vägleda syntetisk biologi.
"Det här systemet för oss närmare en bra första gissning om vad vilken variant som helst gör när vi observerar den hos en människa," förklarar Lareau. DeepMinds forskningschef Pushmeet Kohli beskriver AlphaGenome som "ett stort första steg" mot det slutgiltiga målet att helt simulera cellulära processer med hjälp av AI.