Google DeepMind розробила потужну нову систему штучного інтелекту, яка може докорінно змінити наше розуміння людської генетики, розшифровуючи те, що вчені колись називали «темною матерією» ДНК.
AlphaGenome, випущена 25 червня 2025 року, вирішує одну з найбільших загадок біології: як 98% нашого геному, що не кодує білки напряму, впливає на активність генів і розвиток хвороб. Попередні моделі могли аналізувати лише невеликі фрагменти ДНК або зосереджувались на окремих завданнях, тоді як AlphaGenome обробляє послідовності довжиною до мільйона пар основ і прогнозує тисячі молекулярних властивостей з точністю до окремої літери.
«Вперше ми маємо єдину модель, яка поєднує довготривалий контекст, точність на рівні базових пар і найсучаснішу ефективність у широкому спектрі геномних завдань», — зазначив доктор Калеб Ларо з онкологічного центру Memorial Sloan Kettering, який отримав ранній доступ до технології.
Архітектура моделі поєднує згорткові нейронні мережі для виявлення локальних послідовних патернів із трансформерами для моделювання взаємодій на великих відстанях. У суворих тестах AlphaGenome перевершила як спеціалізовані, так і універсальні моделі у 46 із 50 еталонних випробувань, зокрема у 24 із 26 оцінок прогнозування ефекту генетичних варіантів.
Однією з найважливіших можливостей AlphaGenome є прогнозування сплайсингу РНК — процесу, помилки в якому можуть спричинити рідкісні генетичні захворювання, такі як спінальна м'язова атрофія та деякі форми кістозного фіброзу. Модель також може визначати, як мутації у некодуючих ділянках активують гени, пов’язані з раком, що було продемонстровано на прикладі аналізу гострого лімфобластного лейкозу Т-клітин.
Хоча AlphaGenome ще перебуває на ранніх стадіях і не пройшла клінічну валідацію, вона вже доступна через API для некомерційних досліджень. Вчені вважають, що ця розробка може прискорити медичні дослідження, допомагаючи ідентифікувати мутації, що викликають хвороби, спрямовувати синтетичний дизайн ДНК і поглиблювати фундаментальне розуміння функцій геному.
«Цей інструмент стане важливою частиною пазлу, дозволяючи нам краще розуміти зв’язки для вивчення таких хвороб, як рак», — сказав професор Марк Мансур з University College London. DeepMind планує й надалі вдосконалювати модель і збирати відгуки для подолання поточних обмежень, зокрема труднощів у прогнозуванні взаємодій між ділянками ДНК, що розташовані на відстані понад 100 000 літер.