Google DeepMind запустила AlphaGenome — революційну систему штучного інтелекту, яка розшифровує загадкові некодуючі ділянки людської ДНК, що впливають на регуляцію генів і розвиток захворювань.
На відміну від попередніх геномних моделей ШІ, які зосереджувалися переважно на 2% ДНК, що кодують білки, AlphaGenome працює з рештою 98% — так званою «темною матерією» геному, де міститься багато варіантів, пов’язаних із захворюваннями. Модель здатна обробляти послідовності довжиною до мільйона пар основ, зберігаючи при цьому роздільну здатність на рівні однієї нуклеотидної основи — технічне досягнення, що дозволяє фіксувати як локальні закономірності, так і віддалені регуляторні взаємозв’язки.
«Це справжній прорив для галузі», — зазначає доктор Кейлеб Ларо з Меморіального онкологічного центру імені Слоуна Кеттерінга. «Вперше ми маємо єдину модель, яка поєднує довготривалий контекст, точність на рівні основ і найкращі показники для широкого спектра геномних завдань».
Гібридна архітектура AlphaGenome поєднує згорткові нейронні мережі для виявлення коротких ДНК-мотивів із трансформерними модулями для фіксації далекодіючих взаємодій. Такий підхід дозволяє моделі передбачати тисячі молекулярних властивостей, зокрема рівні експресії генів, патерни сплайсингу РНК, доступність хроматину та те, як мутації можуть порушувати ці процеси. У тестах AlphaGenome перевершила спеціалізовані моделі у 22 з 24 завдань з передбачення послідовностей і в 24 з 26 оцінок впливу варіантів.
Модель уже продемонструвала практичну користь у дослідженнях раку. Під час аналізу мутацій, пов’язаних із гострим лімфобластним лейкозом Т-клітин, AlphaGenome точно передбачила, як певні некодуючі мутації активують онкоген, створюючи нові сайти зв’язування білків — це співпало з експериментальними результатами.
Google надає доступ до AlphaGenome через API для некомерційних досліджень і планує повний реліз у майбутньому. Хоча модель не призначена й не валідувалася для клінічного використання, дослідники вважають, що вона може прискорити розуміння хвороб, допомагаючи ідентифікувати причинні генетичні варіанти та спрямовувати розвиток синтетичної біології.
«Ця система наближає нас до того, щоб мати гарне перше припущення щодо того, як поводитиметься будь-який варіант, коли ми його спостерігаємо у людини», — пояснює Ларо. Віце-президент з досліджень DeepMind Пушміт Кохлі називає AlphaGenome «великим першим кроком» до кінцевої мети — повної симуляції клітинних процесів за допомогою ШІ.