Десятиліттями вчені намагалися зрозуміти призначення 98% людської ДНК, яка безпосередньо не кодує білки — так званої геномної «темної матерії». 25 червня 2025 року Google DeepMind представила потенційне рішення: AlphaGenome, систему штучного інтелекту, створену для інтерпретації цієї загадкової некодуючої ДНК.
На відміну від попередніх моделей, які могли аналізувати лише короткі фрагменти ДНК або не мали точності на рівні окремих нуклеотидів, AlphaGenome здатна обробляти послідовності довжиною до мільйона «літер» із збереженням роздільної здатності на рівні нуклеотидів. Це технічне досягнення дозволяє дослідникам вивчати, як віддалені регуляторні елементи впливають на активність генів — ключовий фактор для розуміння механізмів хвороб.
«Це одна з найфундаментальніших проблем не лише біології — а й усієї науки», — зазначив Пушміт Кохлі, керівник напряму ШІ для науки у DeepMind. Модель прогнозує тисячі молекулярних властивостей, зокрема, де починаються і закінчуються гени у різних тканинах, як відбувається сплайсинг РНК, і які білки зв’язуються з конкретними ділянками ДНК.
У тестах AlphaGenome перевершила спеціалізовані інструменти у 22 з 24 завдань з передбачення послідовностей і зрівнялася або перевищила інші моделі у 24 з 26 оцінок впливу варіантів. Аналізуючи мутації, знайдені у пацієнтів з лейкемією, модель точно передбачила, як некодуючі варіанти активують ген TAL1, пов’язаний із раком, створюючи нове місце зв’язування для білка MYB — відтворивши відомий механізм хвороби, раніше підтверджений лише лабораторними дослідженнями.
«Вперше ми маємо єдину модель, яка поєднує довготривалу контекстуальність, точність на рівні основи та найкращу продуктивність у широкому спектрі геномних завдань», — сказав доктор Калеб Ларо з Меморіального онкологічного центру Слоан Кеттерінг, який отримав ранній доступ до системи.
Попри потужність, AlphaGenome має обмеження. Вона погано справляється з надто віддаленими регуляторними елементами (на відстані понад 100 000 пар основ) і не може прогнозувати індивідуальні медичні наслідки чи риси. DeepMind надає доступ до моделі через API для некомерційних досліджень і планує повний реліз у майбутньому. Дослідники очікують, що це прискорить вивчення хвороб, дозволяючи проводити віртуальні експерименти, які раніше вимагали тривалої лабораторної роботи.