Важный прорыв в области вычислительной биологии: Google DeepMind выпустила AlphaGenome — систему искусственного интеллекта, предназначенную для расшифровки загадочных некодирующих областей, составляющих 98% человеческой ДНК.
Хотя лишь 2% нашего генома непосредственно кодируют белки, оставшаяся «тёмная материя» играет ключевую роль в регуляции активности генов и часто связана с развитием заболеваний. AlphaGenome стала первой комплексной ИИ-моделью, способной анализировать эти сложные регуляторные области в беспрецедентном масштабе и с высокой детализацией.
«Это одна из самых фундаментальных задач не только в биологии — во всей науке», — отметил Пушмит Кохли, руководитель направления ИИ для науки в DeepMind, на пресс-брифинге. Модель основана на успехе AlphaFold, ранее совершившей революцию в предсказании структуры белков и удостоенной Нобелевской премии по химии в прошлом году.
Технические возможности AlphaGenome впечатляют. Она способна обрабатывать последовательности ДНК длиной до одного миллиона пар оснований с разрешением до одного нуклеотида, что позволяет предсказывать тысячи молекулярных характеристик, определяющих регуляцию генов. В тестах AlphaGenome превзошла специализированные модели в 22 из 24 задач по предсказанию последовательностей и сравнялась или превзошла другие в 24 из 26 задач по оценке влияния вариантов.
Модель уже показала практическую пользу в исследованиях заболеваний. При анализе мутаций у пациентов с лейкемией AlphaGenome точно предсказала, как некодирующие варианты активировали онкоген, создавая новый сайт связывания для регуляторного белка. «Определить значимость различных некодирующих вариантов чрезвычайно сложно, особенно в больших масштабах. Этот инструмент — важная часть головоломки», — объяснил профессор Марк Мансур из Университетского колледжа Лондона.
DeepMind предоставила доступ к AlphaGenome через API для некоммерческих исследований и планирует полный релиз в будущем. Хотя у модели есть ограничения — она с трудом справляется с очень отдалёнными взаимодействиями ДНК и пока не прошла клиническую валидацию — это значительный шаг к пониманию работы нашего генома, который может ускорить открытия в области изучения болезней, синтетической биологии и персонализированной медицины.