В значим пробив за компютърната биология Google DeepMind представи AlphaGenome – изкуствен интелект, създаден да разкодира мистериозните некодиращи региони, които съставляват 98% от човешката ДНК.
Докато само 2% от нашия геном директно кодират протеини, останалата „тъмна материя“ играе ключова роля в регулирането на генната активност и често е свързвана с болести. AlphaGenome е първият цялостен AI модел, способен да анализира тези сложни регулаторни области в безпрецедентен мащаб и с висока резолюция.
„Това е един от най-фундаменталните проблеми не само в биологията – а в цялата наука“, заяви Пушмит Коли, ръководител на AI за наука в DeepMind, по време на пресконференция. Моделът надгражда успеха на DeepMind с AlphaFold, който революционизира прогнозирането на протеиновата структура и спечели Нобелова награда по химия миналата година.
Техническите възможности на AlphaGenome са впечатляващи. Той може да обработва ДНК последователности до един милион базови двойки, като същевременно поддържа еднонуклеотидна резолюция, което му позволява да предсказва хиляди молекулярни характеристики, определящи генната регулация. В сравнителни тестове моделът превъзхожда специализирани модели в 22 от 24 задачи за прогнозиране на последователности и се изравнява или надминава други в 24 от 26 оценки за ефект на вариантите.
Моделът вече демонстрира практически приложения в изследванията на болести. При анализ на мутации, открити при пациенти с левкемия, AlphaGenome точно предсказва как некодиращи варианти активират ген, причиняващ рак, чрез създаване на ново място за свързване на регулаторен протеин. „Определянето на значимостта на различни некодиращи варианти може да бъде изключително предизвикателно, особено в голям мащаб. Този инструмент предоставя ключова част от пъзела“, обяснява професор Марк Мансур от University College London.
DeepMind предоставя AlphaGenome чрез API за некомерсиални изследвания, като планира пълноценен публичен достъп в бъдеще. Въпреки че моделът има ограничения – затруднява се с много отдалечени ДНК взаимодействия и не е валидиран за клинична употреба – той представлява значителна стъпка към разбирането на функционирането на нашия геном и може да ускори откритията в изследванията на болестите, синтетичната биология и персонализираната медицина.