У значному прориві для обчислювальної біології Google DeepMind представила AlphaGenome — систему штучного інтелекту, створену для розкриття таємниць некодуючої ДНК, яку часто називають «темною матерією» геному.
Хоча вчені завершили проект «Геном людини» у 2003 році, розкривши повний генетичний код, розуміння функцій більшості цієї ДНК залишається однією з найбільших загадок біології. Лише близько 2% людської ДНК безпосередньо кодує білки, тоді як решта 98% виконує важливі регуляторні функції, які складно інтерпретувати.
AlphaGenome є важливим кроком у вирішенні цієї проблеми. Модель здатна аналізувати надзвичайно довгі послідовності ДНК — до одного мільйона пар основ — і з безпрецедентною точністю прогнозувати тисячі молекулярних властивостей. Серед них — визначення початку й кінця генів у різних тканинах, способи сплайсингу РНК, кількість виробленої РНК та білки, що зв’язуються з конкретними ділянками ДНК.
«Вперше ми створили єдину модель, яка об’єднує багато різних викликів, пов’язаних із розумінням геному», — зазначив Пушміт Кохлі, віцепрезидент з досліджень у DeepMind. Система перевершила спеціалізовані моделі у 22 з 24 тестів на прогнозування послідовностей і зрівнялася або перевершила інші у 24 з 26 завдань з оцінки впливу варіантів.
На відміну від попередніх моделей ШІ для геноміки, які фокусувалися на окремих завданнях або лише на білок-кодуючих ділянках, AlphaGenome пропонує комплексний підхід до інтерпретації всього геному. Аншул Кундже, комп’ютерний геноміст зі Стенфордського університету, який мав ранній доступ до системи, назвав її «реальним покращенням майже всіх сучасних моделей перетворення послідовності у функцію».
Можливості застосування AlphaGenome дуже широкі. Вона може допомогти дослідникам точніше визначати причини захворювань, сприяти створенню синтетичної ДНК із заданими регуляторними властивостями та прискорити розуміння генетичних хвороб. У одному з експериментів модель успішно передбачила, як певні мутації активують пов’язаний із лейкемією ген, створюючи новий сайт зв’язування білка — відтворюючи відомий механізм розвитку хвороби.
AlphaGenome вже доступна через API для некомерційних досліджень, а DeepMind планує згодом оприлюднити повні деталі моделі. Компанія підкреслює, що хоча система є значним проривом, вона не призначена і не перевірена для персонального геномного прогнозування чи клінічного використання.