I ett betydande framsteg för beräkningsbiologin har Google DeepMind lanserat AlphaGenome – ett artificiellt intelligenssystem utvecklat för att avkoda mysterierna kring icke-kodande DNA, ofta kallat genomets 'mörka materia'.
Trots att forskare slutförde Human Genome Project år 2003 och avslöjade vår kompletta genetiska kod, har förståelsen för vad större delen av detta DNA faktiskt gör förblivit en av biologins största utmaningar. Endast cirka 2 % av människans DNA kodar direkt för proteiner, medan de återstående 98 % spelar avgörande reglerande roller som länge varit svåra att tolka.
AlphaGenome utgör ett stort steg framåt för att tackla denna utmaning. Modellen kan analysera extremt långa DNA-sekvenser – upp till en miljon baspar – och förutsäga tusentals molekylära egenskaper med en hittills oöverträffad precision. Det handlar bland annat om var gener börjar och slutar i olika vävnader, hur RNA splitsas, mängden RNA som produceras och vilka proteiner som binder till specifika DNA-regioner.
"Vi har för första gången skapat en enhetlig modell som förenar många av de olika utmaningar som finns med att förstå genomet," säger Pushmeet Kohli, forskningschef på DeepMind. Systemet överträffade specialiserade modeller i 22 av 24 sekvensprediktionsjämförelser och matchade eller överträffade andra i 24 av 26 uppgifter för att förutsäga variant-effekter.
Till skillnad från tidigare AI-modeller inom genomik, som fokuserat på specifika uppgifter eller enbart protein-kodande regioner, erbjuder AlphaGenome ett heltäckande angreppssätt för att tolka hela genomet. Anshul Kundaje, beräkningsgenomiker vid Stanford University som haft tidig tillgång till systemet, beskriver det som "en verklig förbättring jämfört med i stort sett alla nuvarande toppmoderna sekvens-till-funktion-modeller".
Användningsområdena är många. AlphaGenome kan hjälpa forskare att mer exakt identifiera orsaker till sjukdomar, vägleda designen av syntetiskt DNA med specifika reglerande funktioner och påskynda förståelsen av genetiska sjukdomar. I en demonstration lyckades modellen förutsäga hur specifika mutationer aktiverar en cancerrelaterad gen vid leukemi genom att skapa en ny proteinbindningsplats – och därmed återskapa en känd sjukdomsmekanism.
AlphaGenome är nu tillgänglig via API för icke-kommersiell forskning, och DeepMind planerar att släppa fullständiga modelluppgifter framöver. Företaget betonar att även om systemet innebär ett betydande genombrott, är det inte utformat eller validerat för personlig genomprediktion eller klinisk användning.