노벨상 수상 단백질 구조 예측 시스템인 알파폴드를 개발한 AI 연구소 구글 딥마인드가, 이번에는 DNA의 미지의 비암호화 영역을 해독하는 더욱 복잡한 도전에 나섰다.
2025년 6월 공개된 '알파지놈(AlphaGenome)'은 유전체 전반에 걸쳐 유전 변이가 유전자 조절에 미치는 영향을 예측함으로써, 유전체 연구에 있어 획기적인 진전을 이뤄냈다. 인간 DNA의 단 2%만이 단백질을 직접 암호화하는 반면, 한때 '정크 DNA'로 불리던 나머지 98%는 유전자 활성 시기와 방식을 조절하는 데 핵심적인 역할을 한다.
알파지놈의 아키텍처는 짧은 DNA 패턴을 감지하는 합성곱 신경망(CNN)과, 멀리 떨어진 유전체 요소 간의 장거리 상호작용을 포착하는 트랜스포머 모듈을 결합했다. 이 하이브리드 접근법을 통해 알파지놈은 최대 100만 염기쌍에 달하는 긴 서열도 단일 염기 수준의 정밀도로 처리할 수 있게 됐다. 이는 기존 모델들이 맥락 길이와 정밀도 중 하나를 포기해야 했던 한계를 극복한 것이다.
딥마인드 연구 담당 부사장 푸쉬밋 콜리(Pushmeet Kohli)는 "우리는 유전체를 이해하는 데 따르는 다양한 도전 과제를 하나의 모델로 통합하는 데 처음으로 성공했다"고 밝혔다. 시스템은 ENCODE, GTEx, FANTOM5 등 여러 컨소시엄의 공공 데이터베이스를 활용해, 수백 종의 인간 및 생쥐 세포 유형에서 실험적으로 측정된 조절 특성을 학습했다.
알파지놈은 실제 적용 사례에서도 뛰어난 성능을 입증했다. 2025년 6월 사전 공개 논문에서 연구진은 이 모델을 이용해 T세포 급성 림프구성 백혈병에서 특정 돌연변이가 유전자 과발현을 유발하는 과정을 정확히 시뮬레이션했으며, 이는 실험실 실험 없이도 알려진 질병 메커니즘을 재현한 것이다.
이 기술은 질병 연구에 큰 영향을 미칠 전망이다. 과학자들이 유전 변이가 유전자 조절에 미치는 경로를 추적함으로써, 질환의 유전적 원인을 규명하는 데 도움을 줄 수 있기 때문이다. 또한, 특정 조절 기능을 갖춘 DNA 설계를 유도함으로써 합성생물학 연구도 가속화할 수 있다. 딥마인드는 알파지놈을 비상업적 연구 목적으로 API 형태로 공개했으며, 향후 전체 모델도 공개할 계획이다.