Важное достижение в области вычислительной биологии — компания Google DeepMind представила AlphaGenome, систему искусственного интеллекта, предназначенную для расшифровки загадок некодирующей ДНК, которую часто называют «тёмной материей» генома.
Хотя учёные завершили проект «Геном человека» в 2003 году, раскрыв полную генетическую карту человека, понимание функций большей части ДНК остаётся одной из главных задач биологии. Лишь около 2% человеческой ДНК непосредственно кодирует белки, а оставшиеся 98% выполняют важнейшие регуляторные функции, которые долгое время было сложно интерпретировать.
AlphaGenome стала значительным шагом вперёд в решении этой задачи. Модель способна анализировать чрезвычайно длинные последовательности ДНК — до миллиона пар оснований — и с беспрецедентной точностью предсказывать тысячи молекулярных свойств. Среди них — определение границ генов в различных тканях, механизмы сплайсинга РНК, количество синтезируемой РНК и связывание белков с конкретными участками ДНК.
«Впервые нам удалось создать единую модель, объединяющую множество задач, связанных с пониманием генома», — отметил Пушмит Кохли, вице-президент по исследованиям DeepMind. Система превзошла специализированные модели в 22 из 24 тестов на предсказание последовательностей и показала равные или лучшие результаты в 24 из 26 задач по оценке влияния вариантов.
В отличие от предыдущих моделей ИИ для работы с геномом, которые были сосредоточены на отдельных задачах или только на кодирующих белки участках, AlphaGenome предлагает комплексный подход к интерпретации всего генома. Компьютерный геномик из Стэнфордского университета Аншул Кундже, получивший ранний доступ к системе, назвал её «реальным улучшением практически всех современных моделей, связывающих последовательность и функцию».
Возможности применения AlphaGenome весьма широки. Модель может помочь учёным точнее выявлять причины заболеваний, направлять создание синтетической ДНК с заданными регуляторными свойствами и ускорить понимание генетических болезней. В одном из примеров AlphaGenome успешно предсказала, как определённые мутации активируют связанный с раком ген при лейкемии, создавая новый сайт связывания белка — известный механизм заболевания.
AlphaGenome уже доступна через API для некоммерческих исследований, а DeepMind планирует опубликовать подробности о модели в будущем. Компания подчёркивает, что, несмотря на значительный прорыв, система не предназначена и не прошла валидацию для персональных генетических предсказаний или клинического применения.