Десятиліттями науковці намагалися зрозуміти величезні ділянки людської ДНК, які раніше вважалися «сміттям». Хоча повна послідовність людського геному стала відомою ще у 2003 році, функції 98% ДНК, яка напряму не кодує білки, залишалися здебільшого загадкою.
Нова модель штучного інтелекту від Google DeepMind — AlphaGenome — є важливим кроком до розв’язання цієї загадки. Запущена 25 червня 2025 року, система здатна обробляти послідовності ДНК довжиною до мільйона літер і передбачати тисячі молекулярних властивостей у різних тканинах та типах клітин.
«Це одна з найфундаментальніших проблем не лише у біології, а й у всій науці», — зазначив Пушміт Кохлі, керівник напряму AI for Science у DeepMind, під час презентації. Модель «від послідовності до функції» аналізує довгі фрагменти ДНК і прогнозує різні властивості, зокрема рівні експресії генів та вплив мутацій на них.
Революційність AlphaGenome полягає у здатності з безпрецедентною точністю аналізувати некодуючі ділянки ДНК. Попередні моделі змушені були обирати між довжиною послідовності та роздільною здатністю, але AlphaGenome забезпечує обидва ці параметри, дозволяючи прогнозувати за 11 різними модальностями регуляції генів. У 24 з 26 тестів на передбачення ефекту варіантів AlphaGenome перевершила спеціалізовані моделі.
Модель вже продемонструвала практичну користь. Під час аналізу мутацій у пацієнтів із лейкемією AlphaGenome точно передбачила, що некодуючі мутації активували сусідній ген, який спричиняє розвиток раку. Ця можливість може змінити підхід дослідників до генетичних захворювань.
«Ви отримуєте список генних варіантів, але потім хочете зрозуміти, які з них дійсно мають значення і де можна втрутитися», — пояснює Калеб Ларо, комп’ютерний біолог з Memorial Sloan Kettering Cancer Center, який отримав ранній доступ до системи. «Це наближає нас до якісної першої оцінки того, що робитиме будь-який варіант, коли ми спостерігаємо його у людини».
Хоча AlphaGenome ще на ранній стадії, вона вже доступна через API для некомерційних досліджень. DeepMind планує у майбутньому оприлюднити повні деталі моделі, що може відкрити шлях до ширшого застосування у геномній медицині та розробці терапевтичних засобів.