Tutkijat ovat vuosikymmeniä yrittäneet ymmärtää valtavaa osaa ihmisen DNA:sta, jota aiemmin pidettiin 'roskana'. Vaikka koko ihmisen genomisekvenssi saatiin selville jo vuonna 2003, 98 %:n osan, joka ei suoraan koodaa proteiineja, toiminta on pysynyt pitkälti arvoituksena.
Google DeepMindin uusi tekoälymalli AlphaGenome on merkittävä askel tämän mysteerin ratkaisemisessa. 25. kesäkuuta 2025 julkaistu järjestelmä kykenee käsittelemään jopa miljoonan kirjaimen pituisia DNA-jaksoja ja ennustamaan tuhansia molekyylitason ominaisuuksia eri kudoksissa ja solutyypeissä.
"Tämä on yksi perustavanlaatuisimmista ongelmista ei vain biologiassa – vaan koko tieteessä", sanoi Pushmeet Kohli, DeepMindin tieteen tekoälystä vastaava johtaja, julkistuksen yhteydessä. 'Sekvenssistä funktioon' -malli ottaa pitkiä DNA-jaksoja ja ennustaa erilaisia ominaisuuksia, kuten geenien ilmentymistasoja ja sitä, miten mutaatiot voivat niihin vaikuttaa.
AlphaGenomen tekee vallankumoukselliseksi sen kyky analysoida ei-koodaavia alueita ennennäkemättömällä tarkkuudella. Aiemmat mallit joutuivat tasapainoilemaan sekvenssin pituuden ja tarkkuuden välillä, mutta AlphaGenome saavuttaa molemmat: se kykenee ennustamaan geenien säätelyä 11 eri modaliteetissa. Malli päihitti erikoistuneet järjestelmät 24:ssä 26:sta varianttivaikutuksen ennusteessa.
Mallilla on jo osoitettu käytännön sovelluksia. Kun sitä sovellettiin leukemia-potilaiden mutaatioihin, AlphaGenome ennusti tarkasti, että ei-koodaavat mutaatiot aktivoivat läheisen syöpägeenin. Tämä ominaisuus voi mullistaa geenitautien tutkimuksen.
"Saat listan geenimuunnoksista, mutta haluan ymmärtää, mitkä niistä todella vaikuttavat johonkin ja mihin voin puuttua", selitti Caleb Lareau, laskennallinen biologi Memorial Sloan Kettering Cancer Centeristä, joka sai varhaisen pääsyn järjestelmään. "Tämä vie meitä lähemmäs hyvää ensiarvausta siitä, mitä mikäkin variantti tekee, kun havaitsemme sen ihmisessä."
Vaikka AlphaGenome on vielä alkuvaiheessa, se on jo saatavilla API-rajapinnan kautta ei-kaupalliseen tutkimukseen. DeepMind aikoo julkaista mallin yksityiskohdat myöhemmin, mikä voi mahdollistaa laajemmat sovellukset genomiikan lääketieteessä ja uusien hoitojen kehittämisessä.