В продължение на десетилетия учените се опитват да разберат предназначението на 98% от човешката ДНК, която не кодира директно протеини – често наричана „тъмна материя“ на генома. На 25 юни 2025 г. Google DeepMind представи потенциално решение: AlphaGenome – система с изкуствен интелект, създадена да интерпретира тази мистериозна некодираща ДНК.
За разлика от предишни модели, които можеха да анализират само къси ДНК сегменти или нямаха прецизност на ниво единична база, AlphaGenome може да обработва последователности до един милион букви, като същевременно запазва резолюция на ниво нуклеотид. Този технологичен пробив позволява на изследователите да изследват как отдалечени регулаторни елементи влияят върху генната активност – ключов фактор за разбирането на механизмите на заболяванията.
„Това е един от най-фундаменталните проблеми не само в биологията, а и в цялата наука“, казва Пушмит Кохли, ръководител на AI за науката в DeepMind. Моделът прогнозира хиляди молекулярни свойства, включително къде започват и свършват гените в различни тъкани, как се осъществява сплайсингът на РНК и кои протеини се свързват с определени ДНК региони.
В сравнителни тестове AlphaGenome превъзхожда специализирани инструменти в 22 от 24 задачи за предсказване на последователности и се изравнява или надминава други в 24 от 26 оценки за ефект на вариантите. При анализ на мутации, открити при пациенти с левкемия, моделът точно прогнозира как некодиращите варианти активират свързания с рака ген TAL1 чрез създаване на ново място за свързване на протеина MYB – възпроизвеждайки известен механизъм на заболяване, потвърден преди това само чрез лабораторни изследвания.
„За първи път имаме единен модел, който обединява дългосрочен контекст, прецизност на ниво база и върхови постижения в цял спектър от геномни задачи“, казва д-р Калеб Ларо от Мемориалния онкологичен център Слоун Кетеринг, който е имал ранен достъп до системата.
Въпреки мощта си, AlphaGenome има и ограничения. Трудно се справя с изключително отдалечени регулаторни елементи (над 100 000 базови двойки) и не може да предсказва индивидуални здравни резултати или черти. DeepMind предоставя модела чрез API за некомерсиални научни изследвания, като планира пълноценен публичен достъп в бъдеще. Изследователите очакват, че това ще ускори проучванията на заболявания, позволявайки виртуални експерименти, които преди са изисквали обширна лабораторна работа.