何十年もの間、科学者たちはかつて「ジャンク」と見なされていた広大なヒトDNA領域の理解に苦しんできた。2003年にヒトゲノムの全配列が明らかになったものの、タンパク質を直接コードしない98%の部分の機能は依然として謎に包まれていた。
Google DeepMindの新しいAIモデル「AlphaGenome」は、この難題の解決に向けた大きな一歩となる。2025年6月25日に発表されたこのシステムは、最大100万文字のDNA配列を処理し、さまざまな組織や細胞タイプにおける数千もの分子特性を予測できる。
「これは生物学だけでなく、科学全体における最も根本的な問題の一つです」と、発表会でDeepMindのAI for Science責任者Pushmeet Kohli氏は語った。この「シーケンスから機能へ」のモデルは、長いDNA配列から遺伝子発現レベルや変異がそれにどう影響するかなど、さまざまな特性を予測する。
AlphaGenomeが画期的なのは、非コード領域をこれまでにない精度で解析できる点だ。従来のモデルは配列の長さと解像度の間でトレードオフが必要だったが、AlphaGenomeはその両立を実現し、遺伝子制御の11種類のモダリティにわたって予測が可能となった。変異効果予測の26評価中24で、専門特化型モデルを上回る成績を示した。
すでに実用的な応用例も現れている。白血病患者で見つかった変異にAlphaGenomeを適用したところ、非コード変異が近くのがん関連遺伝子を活性化していることを正確に予測した。この能力は、遺伝性疾患の研究アプローチを大きく変える可能性がある。
「遺伝子バリアントのリストを得ても、実際にどれが機能していて、どこに介入できるのかを知りたい」と、同システムをいち早く利用したMemorial Sloan Kettering Cancer Centerの計算生物学者Caleb Lareau氏は説明する。「これにより、ヒトで観察されたバリアントが何をしているのか、良い第一推測に近づくことができる。」
AlphaGenomeはまだ初期段階だが、非商用研究向けにAPI経由で利用可能となっている。DeepMindは今後、モデルの詳細を全面公開する計画であり、ゲノム医療や治療開発への応用拡大が期待される。