U velikom iskoraku za računalnu biologiju, Google DeepMind predstavio je AlphaGenome, sustav umjetne inteligencije osmišljen za dešifriranje tajanstvenih nekodirajućih regija koje čine 98% ljudske DNK.
Dok samo 2% našeg genoma izravno kodira proteine, preostalih 'tamnih' 98% ima ključnu ulogu u regulaciji aktivnosti gena i često su povezane s bolestima. AlphaGenome je prvi sveobuhvatni AI model sposoban za analizu tih složenih regulatornih regija u dosad neviđenom opsegu i rezoluciji.
"Ovo je jedan od najtemeljnijih problema ne samo u biologiji – već u cijeloj znanosti", izjavio je Pushmeet Kohli, voditelj AI odjela za znanost u DeepMindu, na konferenciji za novinare. Model se nadovezuje na prethodni uspjeh DeepMinda s AlphaFoldom, koji je revolucionirao predviđanje strukture proteina i prošle godine podijelio Nobelovu nagradu za kemiju.
Tehničke mogućnosti AlphaGenomea su impresivne. Može obrađivati DNK sekvence duge do milijun baza uz očuvanje rezolucije na razini pojedinačnih nukleotida, što omogućuje predviđanje tisuća molekularnih svojstava koja karakteriziraju gensku regulaciju. U testiranjima je nadmašio specijalizirane modele u 22 od 24 zadatka predviđanja sekvenci te se izjednačio ili nadmašio druge u 24 od 26 evaluacija predviđanja učinka varijanti.
Model je već pokazao praktičnu primjenu u istraživanju bolesti. Prilikom analize mutacija pronađenih kod pacijenata s leukemijom, AlphaGenome je točno predvidio kako nekodirajuće varijante aktiviraju gen koji potiče razvoj raka stvaranjem novog veznog mjesta za regulatorni protein. "Odrediti važnost različitih nekodirajućih varijanti može biti iznimno izazovno, osobito u velikom opsegu. Ovaj alat pruža ključni dio slagalice", objasnio je profesor Marc Mansour s University College London.
DeepMind je omogućio pristup AlphaGenomeu putem API-ja za nekomercijalna istraživanja, a planira i potpuno izdanje u budućnosti. Iako model ima ograničenja – teško se nosi s vrlo udaljenim interakcijama DNK i nije validiran za kliničku upotrebu – predstavlja značajan korak prema razumijevanju funkcioniranja našeg genoma i mogao bi ubrzati otkrića u istraživanju bolesti, sintetskoj biologiji i personaliziranoj medicini.