Google DeepMind запустила AlphaGenome — революционную систему искусственного интеллекта, которая расшифровывает загадочные некодирующие регионы человеческой ДНК, влияющие на регуляцию генов и развитие заболеваний.
В отличие от предыдущих геномных моделей ИИ, сосредоточенных в основном на 2% ДНК, кодирующих белки, AlphaGenome работает с оставшимися 98% — так называемой геномной «тёмной материей», где находится множество вариантов, связанных с болезнями. Модель способна обрабатывать последовательности длиной до миллиона пар оснований, сохраняя при этом разрешение на уровне отдельных нуклеотидов — техническое достижение, позволяющее ей улавливать как локальные паттерны, так и отдалённые регуляторные связи.
«Это веха для всей области», — говорит доктор Калеб Ларо из Онкологического центра имени Слоуна-Кеттеринга. — «Впервые у нас есть единая модель, объединяющая дальнодействующий контекст, точность на уровне оснований и передовую производительность во всём спектре геномных задач».
Гибридная архитектура AlphaGenome сочетает сверточные нейронные сети для обнаружения коротких ДНК-мотивов с трансформерными модулями для захвата дальнодействующих взаимодействий. Такой подход позволяет предсказывать тысячи молекулярных свойств, включая уровни экспрессии генов, паттерны сплайсинга РНК, доступность хроматина и то, как мутации могут нарушать эти процессы. В тестах AlphaGenome превзошла специализированные модели в 22 из 24 задач по предсказанию последовательностей и в 24 из 26 оценок влияния вариантов.
Модель уже показала практическую ценность в исследованиях рака. При анализе мутаций, связанных с острым лимфобластным лейкозом Т-клеток, AlphaGenome точно предсказала, как определённые некодирующие мутации активируют онкоген, создавая новые сайты связывания белков — что совпало с экспериментальными данными.
Google предоставляет доступ к AlphaGenome через API для некоммерческих исследований и планирует полноценный релиз в будущем. Хотя модель не предназначена и не прошла валидацию для клинического применения, исследователи считают, что она может ускорить понимание болезней, помогая выявлять причинные генетические варианты и направлять разработки в области синтетической биологии.
«Эта система приближает нас к тому, чтобы делать обоснованные первые предположения о том, что будет делать любой вариант, когда мы наблюдаем его у человека», — объясняет Ларо. Вице-президент по исследованиям DeepMind Пушмит Кохли называет AlphaGenome «большим первым шагом» к конечной цели — полной симуляции клеточных процессов с помощью ИИ.