Läpimurto laskennallisessa biologiassa: Google DeepMind on esitellyt AlphaGenomen, tekoälyjärjestelmän, joka on suunniteltu purkamaan ei-koodaavan DNA:n – usein genomin 'pimeäksi aineeksi' kutsutun – salaisuuksia.
Vaikka tutkijat saivat valmiiksi Human Genome Projectin vuonna 2003 ja paljastivat koko geneettisen koodimme, suurimman osan DNA:n toiminnan ymmärtäminen on pysynyt yhtenä biologian suurimmista haasteista. Vain noin 2 % ihmisen DNA:sta koodaa suoraan proteiineja, kun taas jäljelle jäävä 98 % säätelee elintärkeitä prosesseja, joita on ollut vaikea tulkita.
AlphaGenome on merkittävä askel tämän haasteen ratkaisemisessa. Malli pystyy analysoimaan erittäin pitkiä DNA-jaksoja – jopa miljoonan emäsparin mittaisia – ja ennustamaan tuhansia molekyylitason ominaisuuksia ennennäkemättömällä tarkkuudella. Näihin kuuluvat muun muassa geenien alku- ja loppukohdat eri kudoksissa, RNA:n silmukointi, tuotetun RNA:n määrä sekä se, mitkä proteiinit sitoutuvat tiettyihin DNA-alueisiin.
"Olemme ensimmäistä kertaa luoneet yhden mallin, joka yhdistää monet genomin ymmärtämiseen liittyvät haasteet", sanoo DeepMindin tutkimusjohtaja Pushmeet Kohli. Järjestelmä päihitti erikoistuneet mallit 22:ssa 24:stä sekvenssiennusteen vertailutestissä ja ylsi samaan tai parempaan tulokseen 24:ssä 26:sta varianttivaikutuksen ennustetehtävässä.
Toisin kuin aiemmat genomiikan tekoälymallit, jotka keskittyivät tiettyihin tehtäviin tai vain proteiinia koodaaviin alueisiin, AlphaGenome tarjoaa kokonaisvaltaisen lähestymistavan koko genomin tulkintaan. Stanfordin yliopiston laskennallisen genomiikan tutkija Anshul Kundaje, joka sai varhaisen käyttöoikeuden järjestelmään, kuvaili sitä "todelliseksi parannukseksi käytännössä kaikkiin nykyisiin huipputason sekvenssi-funktiomalleihin".
Sovellusmahdollisuudet ovat laajat. AlphaGenome voi auttaa tutkijoita tunnistamaan sairauksien syitä tarkemmin, ohjata synteettisen DNA:n suunnittelua tietyillä säätelyominaisuuksilla ja nopeuttaa geneettisten sairauksien ymmärtämistä. Yhdessä esimerkissä malli onnistui ennustamaan, miten tietyt mutaatiot aktivoivat leukemiaan liittyvän geenin luomalla uuden proteiinin sitoutumiskohdan – toistaen tunnetun tautimekanismin.
AlphaGenome on nyt saatavilla API-rajapinnan kautta ei-kaupalliseen tutkimuskäyttöön, ja DeepMind aikoo julkaista koko mallin yksityiskohdat myöhemmin. Yhtiö korostaa, että vaikka järjestelmä on merkittävä läpimurto, sitä ei ole suunniteltu tai validoitu henkilökohtaiseen genomiennustamiseen tai kliiniseen käyttöön.