Исследовательская лаборатория искусственного интеллекта Google DeepMind, создавшая удостоенную Нобелевской премии систему AlphaFold для предсказания структуры белков, разработала новый мощный инструмент, решающий ещё более сложную задачу: расшифровку загадочных некодирующих областей ДНК.
AlphaGenome, представленная в июне 2025 года, стала крупным прорывом в геномных исследованиях, позволяя предсказывать, как генетические варианты влияют на регуляцию генов по всему геному. Хотя только 2% человеческой ДНК непосредственно кодируют белки, оставшиеся 98% — ранее считавшиеся «мусорной ДНК» — играют ключевую роль в управлении тем, когда и как активируются гены.
Архитектура модели сочетает сверточные нейронные сети для обнаружения коротких паттернов ДНК с трансформерными модулями, улавливающими дальнодействующие взаимодействия между удалёнными элементами генома. Такой гибридный подход позволяет AlphaGenome обрабатывать последовательности длиной до миллиона пар оснований, сохраняя при этом разрешение на уровне одной буквы — значительное улучшение по сравнению с предыдущими моделями, которым приходилось жертвовать либо длиной контекста, либо точностью.
«Впервые нам удалось создать единую модель, объединяющую множество различных задач, связанных с пониманием генома», — отметил Пушмит Кохли, вице-президент по исследованиям в DeepMind. Система обучалась на открытых базах данных консорциумов ENCODE, GTEx и FANTOM5, в которых экспериментально измерялись регуляторные свойства сотен типов человеческих и мышиных клеток.
AlphaGenome уже доказала свою эффективность в реальных задачах. В препринте июня 2025 года исследователи с помощью модели точно смоделировали, как определённые мутации вызывают сверхэкспрессию генов при остром лимфобластном лейкозе Т-клеток, воспроизводя известные механизмы заболевания без лабораторных экспериментов.
Эта технология имеет большое значение для медицинских исследований: она может помочь учёным выявлять генетические причины заболеваний, отслеживая влияние мутаций на регуляцию генов. Кроме того, AlphaGenome способна ускорить развитие синтетической биологии, помогая проектировать ДНК с заданными регуляторными функциями. DeepMind уже открыла доступ к AlphaGenome через API для некоммерческих исследований и планирует в будущем опубликовать полную версию модели.