何十年もの間、科学者たちはタンパク質をコードしない広大なヒトDNA領域の理解に苦しんできた。ゲノムの98%を占めるこれら非コード領域は、遺伝子発現の調節に重要な役割を果たしているにもかかわらず、その機能は長らく謎に包まれており、「遺伝子のダークマター」とも呼ばれてきた。
Google DeepMindが2025年6月25日に発表した新しいAIモデル「AlphaGenome」は、このゲノムの謎を解き明かす大きなブレークスルーとなる。AlphaGenomeは最大100万塩基対のDNA配列を解析し、遺伝子発現レベルやRNAスプライシングパターン、遺伝的変異の影響など、数千に及ぶ分子特性をこれまでにない精度で予測できる。
「初めて、長距離コンテキスト、塩基レベルの精度、そして最先端の性能を、ゲノム関連タスク全体で統合した単一モデルが誕生しました」と、技術の早期アクセスを得たMemorial Sloan Kettering Cancer CenterのCaleb Lareau博士は語る。
AlphaGenomeは、24の配列予測ベンチマークのうち22で専門特化モデルを上回り、26の変異効果タスクのうち24で同等またはそれ以上の成績を収めた。そのアーキテクチャは、畳み込みニューラルネットワークで局所的な配列パターンを検出し、トランスフォーマーで長距離相互作用をモデル化するというもので、すべて公的コンソーシアムの豊富なマルチオミクスデータセットで訓練されている。
このモデルはすでにがん研究で実用的な成果を示している。プレプリント論文では、研究者がAlphaGenomeを用いて、T細胞性急性リンパ性白血病において特定の変異ががん関連遺伝子TAL1をどのように活性化するかを予測し、既知の疾患メカニズムを再現することに成功した。
現在、AlphaGenomeは非商用研究向けにAPI経由で利用可能だが、非常に遠距離のDNA相互作用の予測が苦手であることや、臨床利用の検証がなされていないなどの制約もある。それでも、非コード変異ががんから希少遺伝性疾患に至るまで、さまざまな病気にどのように関与するかを解明することで、ゲノム医療に大きなインパクトをもたらす可能性がある。AlphaGenomeは新たな治療法の開発を加速させ、将来的には個別化医療を変革することが期待されている。