Desítky let se vědci snažili pochopit účel 98 % lidské DNA, která přímo nekóduje proteiny—a často bývá označována jako genomová „temná hmota“. Dne 25. června 2025 Google DeepMind představil možné řešení: AlphaGenome, umělou inteligenci navrženou k interpretaci této záhadné nekódující DNA.
Na rozdíl od předchozích modelů, které dokázaly analyzovat jen krátké úseky DNA nebo postrádaly přesnost na úrovni jednotlivých bází, AlphaGenome zvládá zpracovat sekvence až o délce jednoho milionu písmen při zachování rozlišení na úrovni nukleotidů. Tento technický průlom umožňuje vědcům zkoumat, jak vzdálené regulační prvky ovlivňují aktivitu genů—což je klíčové pro pochopení mechanismů nemocí.
„Jde o jeden z nejzákladnějších problémů nejen v biologii, ale v celé vědě,“ uvedl Pushmeet Kohli, vedoucí AI pro vědu ve společnosti DeepMind. Model předpovídá tisíce molekulárních vlastností, včetně toho, kde začínají a končí geny v různých tkáních, jak probíhá sestřih RNA a které proteiny se vážou na konkrétní oblasti DNA.
V srovnávacích testech AlphaGenome překonal specializované nástroje ve 22 z 24 úloh předpovědi sekvencí a vyrovnal se nebo předčil ostatní v 24 z 26 hodnocení vlivu variant. Při analýze mutací nalezených u pacientů s leukémií model přesně předpověděl, jak nekódující varianty aktivují s rakovinou spojený gen TAL1 vytvořením nového vazebného místa pro protein MYB—čímž napodobil známý mechanismus nemoci, který byl dosud potvrzen pouze laboratorními studiemi.
„Poprvé máme jediný model, který spojuje dlouhodobý kontext, přesnost na úrovni bází a špičkový výkon napříč celým spektrem genomických úloh,“ říká Dr. Caleb Lareau z Memorial Sloan Kettering Cancer Center, který měl k systému předběžný přístup.
Ačkoliv je AlphaGenome velmi výkonný, má i své limity. Zatím si neporadí s extrémně vzdálenými regulačními prvky (nad 100 000 bází) a nedokáže předpovídat individuální zdravotní výsledky či vlastnosti. DeepMind zpřístupňuje model přes API pro nekomerční výzkum a plánuje jeho plné zveřejnění v budoucnu. Vědci očekávají, že urychlí studium nemocí tím, že umožní virtuální experimenty, které dříve vyžadovaly rozsáhlou laboratorní práci.