Ve významném pokroku v oblasti výpočetní biologie představila společnost Google DeepMind systém AlphaGenome – umělou inteligenci navrženou k rozluštění záhad nekódující DNA, často označované jako „temná hmota“ genomu.
Ačkoliv vědci dokončili projekt lidského genomu v roce 2003 a odhalili tak naši kompletní genetickou informaci, pochopení funkce většiny této DNA zůstávalo jednou z největších výzev biologie. Pouze asi 2 % lidské DNA přímo kóduje proteiny, zatímco zbývajících 98 % hraje zásadní regulační roli, kterou bylo dosud obtížné interpretovat.
AlphaGenome představuje významný krok vpřed v řešení tohoto problému. Model dokáže analyzovat extrémně dlouhé sekvence DNA – až o délce jednoho milionu bází – a s bezprecedentní přesností předpovídat tisíce molekulárních vlastností. Patří mezi ně například určení začátků a konců genů v různých tkáních, způsob sestřihu RNA, množství produkované RNA či to, které proteiny se vážou na konkrétní úseky DNA.
„Poprvé jsme vytvořili jediný model, který sjednocuje mnoho různých výzev spojených s pochopením genomu,“ uvedl Pushmeet Kohli, viceprezident pro výzkum ve společnosti DeepMind. Systém překonal specializované modely ve 22 z 24 testů predikce sekvencí a vyrovnal se nebo předčil ostatní v 24 z 26 úlohách predikce efektu variant.
Na rozdíl od předchozích genomických AI modelů, které se zaměřovaly na konkrétní úkoly nebo pouze na protein-kódující oblasti, AlphaGenome nabízí komplexní přístup k interpretaci celého genomu. Výpočetní genomik Anshul Kundaje ze Stanfordovy univerzity, který měl k systému přednostní přístup, jej označil za „skutečné zlepšení téměř všech současných špičkových modelů převodu sekvence na funkci“.
Možné aplikace jsou velmi široké. AlphaGenome by mohl pomoci vědcům přesněji určit příčiny nemocí, usnadnit návrh syntetické DNA se specifickými regulačními funkcemi a urychlit naše chápání genetických onemocnění. V jedné ukázce model úspěšně předpověděl, jak konkrétní mutace aktivuje gen související s rakovinou u leukémie vytvořením nového vazebného místa pro protein, čímž napodobil známý mechanismus vzniku nemoci.
AlphaGenome je nyní dostupný přes API pro nekomerční výzkum a DeepMind plánuje v budoucnu zveřejnit detailní informace o modelu. Společnost zdůrazňuje, že ačkoliv systém představuje významný průlom, nebyl navržen ani ověřen pro predikci osobního genomu či klinické použití.