Google DeepMind досягла значного прориву в галузі обчислювальної біології завдяки AlphaGenome — системі штучного інтелекту, яка розшифровує найзагадковіші ділянки людського геному.
Представлена 25 червня 2025 року, AlphaGenome вирішує проблему так званої генетичної «темної матерії» — 98% нашої ДНК, яка не кодує білки, але відіграє ключову роль у регуляції експресії генів. Хоча раніше ці некодуючі ділянки вважалися «сміттєвою ДНК», нині дослідники визнають, що вони містять життєво важливі регуляторні інструкції, порушення яких може призводити до захворювань.
Відмінною рисою AlphaGenome є здатність обробляти надзвичайно довгі послідовності ДНК — до 1 мільйона пар основ — з точністю до окремої основи. Модель прогнозує тисячі молекулярних властивостей, включаючи рівні експресії генів, патерни сплайсингу РНК та сайти зв’язування білків. Вона також може оцінювати генетичні варіанти, порівнюючи прогнози для мутованих і немутованих послідовностей.
«Вперше ми маємо єдину модель, яка поєднує широкий контекст, точність на рівні основи та найсучасніші результати для цілого спектра геномних завдань», — зазначив доктор Калеб Ларо з Меморіального онкологічного центру ім. Слоуна Кеттерінга, який отримав ранній доступ до системи.
AlphaGenome вже продемонструвала вражаючі можливості у дослідженнях раку. У тестах із гострим лімфобластним лейкозом Т-клітин модель точно передбачила, як певні мутації активують пов’язаний із раком ген TAL1, створюючи новий сайт зв’язування для білка MYB — відтворивши відомий механізм розвитку хвороби, раніше підтверджений лише лабораторними дослідженнями.
Рут Порат, президентка та головна інвестиційна директорка Alphabet і Google, підкреслила важливість цієї технології під час свого виступу на засіданні Американського товариства клінічної онкології. Як людина, що пережила рак молочної залози, Порат наголосила, що дослідження Google у сфері ШІ відкривають значні перспективи для ранньої діагностики та лікування онкологічних захворювань.
DeepMind вже надала доступ до AlphaGenome через API для некомерційних досліджень і планує повний реліз у майбутньому. Хоча модель поки що не призначена для інтерпретації персональних геномів чи клінічного застосування, вона є потужним новим інструментом, який може прискорити відкриття у дослідженнях хвороб, синтетичній біології та фундаментальній науці.