在计算生物学领域取得重大突破之际,Google DeepMind 推出了 AlphaGenome——一款旨在解码占人类 DNA 98% 的神秘非编码区域的人工智能系统。
虽然人类基因组中只有约 2% 直接编码蛋白质,其余被称为“暗物质”的部分在调控基因活性方面发挥着关键作用,并常常与疾病相关。AlphaGenome 是首个能够以前所未有的规模和分辨率分析这些复杂调控区域的综合性 AI 模型。
“这不仅是生物学领域最根本的问题之一,也是整个科学界最根本的问题之一。”DeepMind 科学 AI 负责人 Pushmeet Kohli 在新闻发布会上表示。该模型建立在 DeepMind 先前 AlphaFold 的成功基础之上,AlphaFold 曾彻底改变了蛋白质结构预测,并在去年获得了诺贝尔化学奖。
AlphaGenome 在技术能力上表现出色。它能够处理长达一百万碱基对的 DNA 序列,同时保持单核苷酸级别的分辨率,从而预测数千种表征基因调控的分子属性。在基准测试中,AlphaGenome 在 24 项序列预测任务中有 22 项优于专业模型,在 26 项变异效应预测评估中有 24 项达到或超过其他模型。
该模型已在疾病研究中展现出实际应用价值。例如,在分析白血病患者的突变时,AlphaGenome 能准确预测非编码变异如何通过创造新的调控蛋白结合位点激活致癌基因。伦敦大学学院的 Marc Mansour 教授解释道:“在大规模下判定不同非编码变异的相关性极具挑战性,这一工具为解题提供了关键拼图。”
DeepMind 已通过 API 向非商业研究开放 AlphaGenome,并计划未来全面发布。尽管该模型仍有局限——如难以处理极远距离的 DNA 互作,且尚未获得临床应用验证——但它代表了理解人类基因组功能的重要一步,有望加速疾病研究、合成生物学和个性化医疗等领域的发现。