수십 년 동안 과학자들은 단백질을 암호화하지 않는 인간 DNA의 방대한 영역을 이해하는 데 어려움을 겪어왔다. 전체 유전체의 98%를 차지하는 이 비암호화 영역은 유전자 발현을 조절하는 데 중요한 역할을 함에도 불구하고, 그 기능이 대부분 미스터리로 남아 있어 '유전적 암흑물질'로 불리기도 했다.
2025년 6월 25일 공개된 구글 딥마인드의 새로운 AI 모델 '알파지놈(AlphaGenome)'은 이 유전체 퍼즐을 해독하는 데 있어 중대한 돌파구를 마련했다. 이 모델은 최대 100만 염기쌍에 달하는 DNA 서열을 분석할 수 있으며, 유전자 발현 수준, RNA 스플라이싱 패턴, 유전적 돌연변이의 영향 등 수천 가지 분자적 특성을 전례 없는 정확도로 예측할 수 있다.
메모리얼 슬론 케터링 암센터(Memorial Sloan Kettering Cancer Center)의 케일럽 라로(Dr. Caleb Lareau) 박사는 "처음으로, 장거리 맥락과 염기 단위의 정밀성, 그리고 다양한 유전체 과제에서 최첨단 성능을 통합한 단일 모델이 등장했다"고 평가했다. 그는 이 기술을 조기에 접할 기회를 가졌다.
알파지놈은 24개 서열 예측 벤치마크 중 22개에서 기존 특화 모델을 능가했으며, 26개 변이 효과 예측 과제 중 24개에서 동등하거나 더 나은 성능을 보였다. 이 모델의 아키텍처는 컨볼루션 신경망(CNN)으로 국소 서열 패턴을 감지하고, 트랜스포머(Transformer)로 장거리 상호작용을 모델링하며, 모두 공개 컨소시엄의 풍부한 멀티오믹 데이터셋으로 학습됐다.
이 모델은 이미 암 연구에서 실질적인 활용 사례를 보여주고 있다. 한 사전 공개 연구(preprint)에서 연구진은 알파지놈을 이용해 특정 돌연변이가 T-세포 급성 림프구성 백혈병에서 암 관련 유전자 TAL1을 어떻게 활성화하는지 성공적으로 예측했으며, 이는 이미 알려진 질병 메커니즘을 재현한 것이다.
현재 알파지놈은 비상업적 연구 목적으로만 API를 통해 제공되고 있으며, 한계점도 존재한다. 예를 들어, 매우 먼 거리의 DNA 상호작용 예측에는 어려움이 있고, 임상적 사용을 위한 검증도 아직 이루어지지 않았다. 그럼에도 불구하고, 비암호화 변이가 암부터 희귀 유전 질환에 이르기까지 다양한 질병에 어떻게 기여하는지 이해하는 데 도움을 줌으로써, 알파지놈은 새로운 치료법 개발을 가속화하고 궁극적으로 맞춤형 의학을 혁신할 잠재력이 크다.