menu
close

DeepMind人工智能解码DNA“暗物质”,预测疾病风险

Google DeepMind发布了AlphaGenome,这是一款突破性的人工智能模型,能够解读人类基因组中不编码蛋白质但调控基因活性的非编码区域——占据DNA的98%。该模型可分析长达一百万碱基对的序列,并预测遗传变异如何影响包括基因表达和剪接模式在内的多种生物过程。获得早期访问权的科学家称其为“令人振奋的重大进步”,在预测非编码突变如何导致癌症等疾病方面,AlphaGenome表现优于现有模型。
DeepMind人工智能解码DNA“暗物质”,预测疾病风险

数十年来,科学家一直难以理解人类DNA中那98%不直接编码蛋白质的部分——通常被称为基因组“暗物质”。2025年6月25日,Google DeepMind发布了一项潜在的解决方案:AlphaGenome,这是一套专为解读神秘非编码DNA而设计的人工智能系统。

与以往只能分析短DNA片段或缺乏单碱基精度的模型不同,AlphaGenome能够处理长达一百万个碱基的序列,并保持核苷酸级别的分辨率。这一技术突破使研究人员能够探究远距离调控元件如何影响基因活性——这是理解疾病机制的关键因素。

“这不仅是生物学领域,也是整个科学界最根本的问题之一。”DeepMind科学人工智能负责人Pushmeet Kohli表示。该模型可预测数千种分子属性,包括不同组织中基因的起止位置、RNA的剪接方式,以及哪些蛋白质会与特定DNA区域结合。

在基准测试中,AlphaGenome在24项序列预测任务中有22项优于专业工具,在26项变异效应评估中有24项达到或超过其他模型。当分析白血病患者的突变时,该模型准确预测了非编码变异如何通过为MYB蛋白创造新的结合位点而激活与癌症相关的TAL1基因——这一疾病机制此前仅通过实验室研究得到证实。

“我们首次拥有了一个统一长距离上下文、单碱基精度和业界领先性能于一体的模型,能够覆盖整个基因组任务的广泛领域。”获得早期访问权的纪念斯隆凯特琳癌症中心(Memorial Sloan Kettering Cancer Center)科学家Caleb Lareau博士表示。

尽管功能强大,AlphaGenome仍有局限。例如,它难以处理距离超过10万个碱基对的极远调控元件,也无法预测个人健康结果或性状。DeepMind目前通过API向非商业研究开放该模型,并计划未来全面发布。研究人员预计,这将加速疾病研究进程,使许多过去需要大量实验室工作的实验能够虚拟完成。

Source:

Latest News