Ve významném průlomu v oblasti výpočetní biologie představila společnost Google DeepMind AlphaGenome, systém umělé inteligence navržený k dešifrování záhadných nekódujících oblastí, které tvoří 98 % lidské DNA.
Zatímco pouze 2 % našeho genomu přímo kóduje proteiny, zbývající „temná hmota“ hraje klíčovou roli v regulaci genové aktivity a často je spojována s nemocemi. AlphaGenome představuje první komplexní AI model schopný analyzovat tyto složité regulační oblasti v dosud nevídaném rozsahu a rozlišení.
„Jde o jeden z nejzákladnějších problémů nejen v biologii, ale v celé vědě,“ uvedl Pushmeet Kohli, vedoucí AI pro vědu ve společnosti DeepMind, na tiskové konferenci. Model navazuje na předchozí úspěch DeepMind s AlphaFold, který způsobil revoluci v předpovídání struktury proteinů a loni získal Nobelovu cenu za chemii.
Technické možnosti AlphaGenome jsou působivé. Dokáže zpracovávat sekvence DNA dlouhé až jeden milion bází při zachování rozlišení na úrovni jednotlivých nukleotidů, což mu umožňuje předpovídat tisíce molekulárních vlastností charakterizujících genovou regulaci. V testech výkonnosti překonal specializované modely ve 22 z 24 úloh predikce sekvencí a vyrovnal se nebo překonal ostatní v 24 z 26 hodnocení predikce účinku variant.
Model již prokázal praktické využití ve výzkumu nemocí. Při analýze mutací nalezených u pacientů s leukémií AlphaGenome přesně předpověděl, jak nekódující varianty aktivovaly gen podporující vznik rakoviny tím, že vytvořily nové vazebné místo pro regulační protein. „Určit význam jednotlivých nekódujících variant může být mimořádně náročné, zejména ve velkém měřítku. Tento nástroj poskytuje zásadní dílek do skládačky,“ vysvětlil profesor Marc Mansour z University College London.
DeepMind zpřístupnil AlphaGenome prostřednictvím API pro nekomerční výzkum a plánuje jeho plné uvolnění v budoucnu. Přestože má model své limity – například obtížně zvládá velmi vzdálené interakce v DNA a není ověřen pro klinické použití – představuje významný krok k pochopení fungování našeho genomu a může urychlit objevy ve výzkumu nemocí, syntetické biologii i personalizované medicíně.