컴퓨터 생물학 분야에서 중대한 돌파구가 마련됐다. 구글 딥마인드는 인간 DNA의 98%를 차지하는 미지의 비암호화 영역을 해독하기 위해 설계된 인공지능 시스템 '알파지노믹(AlphaGenome)'을 공개했다.
우리 유전체의 단 2%만이 단백질을 직접 암호화하지만, 나머지 '암흑물질'은 유전자 활동을 조절하는 데 핵심적인 역할을 하며, 종종 질병과도 연관된다. 알파지노믹은 이 복잡한 조절 영역을 전례 없는 규모와 해상도로 분석할 수 있는 최초의 종합 AI 모델이다.
딥마인드의 과학 분야 AI 책임자인 푸쉬밋 콜리(Pushmeet Kohli)는 기자간담회에서 "이것은 생물학뿐 아니라 과학 전체에서 가장 근본적인 문제 중 하나"라고 말했다. 이 모델은 지난해 노벨 화학상을 공동 수상하며 단백질 구조 예측에 혁신을 가져온 알파폴드(AlphaFold)의 성공을 기반으로 개발됐다.
알파지노믹의 기술적 역량은 매우 뛰어나다. 이 시스템은 최대 100만 염기쌍의 DNA 서열을 단일 뉴클레오타이드 해상도로 처리할 수 있어, 유전자 조절을 특징짓는 수천 가지 분자적 특성을 예측할 수 있다. 벤치마킹 테스트에서 알파지노믹은 24개의 서열 예측 과제 중 22개에서 특화 모델을 능가했으며, 26개의 변이 효과 예측 평가 중 24개에서 기존 모델과 동등하거나 더 나은 성능을 보였다.
이 모델은 이미 질병 연구에서 실질적인 활용 가능성을 입증했다. 백혈병 환자에게서 발견된 돌연변이를 분석할 때, 알파지노믹은 비암호화 변이가 조절 단백질의 새로운 결합 부위를 생성해 암 유발 유전자를 활성화하는 과정을 정확히 예측했다. 유니버시티 칼리지 런던의 마크 만수르(Marc Mansour) 교수는 "다양한 비암호화 변이의 중요성을 대규모로 파악하는 것은 매우 어려운 일이다. 이 도구는 그 퍼즐의 중요한 조각을 제공한다"고 설명했다.
딥마인드는 알파지노믹을 비상업적 연구 목적으로 API를 통해 공개했으며, 향후 전체 공개를 계획하고 있다. 이 모델은 아직 매우 먼 거리의 DNA 상호작용을 다루는 데 한계가 있고, 임상적 활용을 위한 검증도 이루어지지 않았지만, 우리 유전체의 작동 원리를 이해하는 데 중요한 진전을 이뤘으며, 질병 연구, 합성 생물학, 맞춤 의학 분야의 발견을 가속화할 것으로 기대된다.