在计算生物学领域取得的重大突破中,谷歌 DeepMind 开发出了一套能够破解生物学最大谜题之一的人工智能系统:解读我们基因组中非编码区域的功能。
AlphaGenome 于 6 月 25 日正式发布,标志着基因组人工智能领域的一次重大飞跃。此前的模型如 AlphaFold 主要解决蛋白质折叠问题,而 AlphaGenome 则应对更为复杂的挑战——解读曾被视为“垃圾”的 98% 人类 DNA,如今已被认为在调控基因活性方面至关重要。
该模型具备前所未有的能力。它能够分析长达 100 万碱基对的 DNA 序列,并预测数千种分子特性,包括基因表达水平、RNA 剪接模式以及基因突变的影响。研究人员首次可以利用同一个工具,同时探索 DNA 变异如何影响多种生物过程。
DeepMind 研究副总裁 Pushmeet Kohli 表示:“我们首次创建了一个统一模型,能够应对理解基因组所带来的多种挑战。”该模型在 26 项基因组预测基准测试中,有 24 项超越了专业系统。
纪念斯隆凯特琳癌症中心的研究员 Caleb Lareau 博士是 AlphaGenome 的早期用户,他称其为“该领域的里程碑”,能够“提供远距离上下文、碱基级精度,并在整个基因组任务谱上实现最先进的性能”。
尽管仍处于早期阶段,AlphaGenome 在理解遗传疾病方面展现出巨大潜力。它可以预测非编码区突变如何通过扰乱基因调控导致癌症和罕见疾病。在一项测试中,该模型成功预测了特定突变如何激活白血病相关基因。
DeepMind 已通过 API 向非商业研究开放 AlphaGenome,并计划未来全面发布模型。公司设想其应用范围涵盖疾病研究到合成生物设计,有望彻底变革基因组医学,加速新疗法的开发。