Ważny postęp w biologii obliczeniowej ogłosiło Google DeepMind, prezentując AlphaGenome – system sztucznej inteligencji zaprojektowany do rozszyfrowywania tajemnic niekodującego DNA, często określanego mianem „ciemnej materii” genomu.
Choć Projekt Poznania Ludzkiego Genomu zakończono w 2003 roku, ujawniając pełny zapis genetyczny człowieka, zrozumienie funkcji większości DNA pozostawało jednym z największych wyzwań biologii. Zaledwie około 2% ludzkiego DNA koduje białka, podczas gdy pozostałe 98% pełni kluczowe, lecz trudne do interpretacji role regulacyjne.
AlphaGenome stanowi istotny krok naprzód w rozwiązywaniu tego problemu. Model potrafi analizować niezwykle długie sekwencje DNA – do miliona par zasad – i z niespotykaną dotąd precyzją przewidywać tysiące właściwości molekularnych. Obejmuje to m.in. lokalizację początków i końców genów w różnych tkankach, sposób składania RNA, ilość produkowanego RNA oraz to, które białka wiążą się z konkretnymi fragmentami DNA.
„Po raz pierwszy stworzyliśmy jeden model, który łączy wiele różnych wyzwań związanych z rozumieniem genomu” – powiedział Pushmeet Kohli, wiceprezes ds. badań w DeepMind. System przewyższył wyspecjalizowane modele w 22 z 24 testów predykcji sekwencji oraz dorównał lub przewyższył inne w 24 z 26 zadań przewidywania efektów wariantów.
W przeciwieństwie do wcześniejszych modeli AI genomiki, które skupiały się na konkretnych zadaniach lub wyłącznie na regionach kodujących białka, AlphaGenome oferuje kompleksowe podejście do interpretacji całego genomu. Anshul Kundaje, bioinformatyk z Uniwersytetu Stanforda, który miał wczesny dostęp do systemu, określił go jako „prawdziwy postęp względem wszystkich obecnych modeli sekwencja–funkcja”.
Potencjalne zastosowania są bardzo szerokie. AlphaGenome może pomóc naukowcom precyzyjniej wskazywać przyczyny chorób, wspierać projektowanie syntetycznego DNA o określonych funkcjach regulacyjnych i przyspieszyć rozumienie chorób genetycznych. W jednym z pokazów model poprawnie przewidział, jak konkretne mutacje aktywują gen związany z białaczką poprzez utworzenie nowego miejsca wiązania białka, odtwarzając znany mechanizm choroby.
AlphaGenome jest już dostępny przez API do niekomercyjnych badań naukowych, a DeepMind planuje w przyszłości udostępnić szczegółowe informacje o modelu. Firma podkreśla, że choć system stanowi znaczący przełom, nie został zaprojektowany ani zwalidowany do przewidywania indywidualnych genomów czy zastosowań klinicznych.