영국 연구진이 과학자들의 신소재 발견과 설계 방식을 혁신할 수 있는 강력한 AI 도구를 개발했다.
리버풀 대학교와 사우샘프턴 대학교 팀은 CrystalGPT(공식 명칭: Molecular Crystal Representation from Transformers, MCRT)를 공개했다. 이 트랜스포머 기반 모델은 케임브리지 구조 데이터베이스(CSD)에 수록된 706,126개의 실험적 결정 구조를 사전 학습해, 분자 결정의 복잡한 언어를 스스로 익혔다.
CrystalGPT의 가장 큰 특징은 이중 표현 방식에 있다. 이 모델은 그래프 기반의 원자 결합 분석과 위상 이미징 기능을 결합해, 분자 구조의 미시적 세부와 거시적 패턴을 동시에 처리할 수 있다. 이러한 멀티모달 접근법은 AI가 결정 특성을 미시적·거시적 수준 모두에서 포괄적으로 이해하도록 돕는다.
리버풀 대학교의 팀원 제노폰 에반젤로풀로스는 "MCRT는 주어진 문제에 맞게 소량의 데이터만으로도 쉽게 파인튜닝할 수 있는 파운데이션 모델로 설계됐다"고 설명했다. 실험과 계산이 비용과 시간이 많이 드는 화학 분야에서, 적은 데이터로도 효과적으로 작동하는 이 능력은 특히 가치가 크다.
이 모델은 네 가지 사전 학습 과제를 활용해 결정의 지역적·전역적 표현을 모두 추출한다. 특정 응용 분야에 맞게 파인튜닝하면, CrystalGPT는 기존보다 훨씬 적은 데이터만으로도 밀도, 다공성, 대칭성 등 핵심 소재 특성을 놀라운 정확도로 예측할 수 있다.
이러한 혁신은 소재 과학에 큰 의미를 지닌다. 기존의 결정 구조 및 특성 예측 계산법은 막대한 자원이 소요되는 것으로 악명 높다. CrystalGPT는 이러한 한계를 극복해, 제약, 유기 전자, 배터리 개발, 가스 저장용 다공성 소재 등 다양한 분야에서 연구 속도를 대폭 높일 것으로 기대된다. 리버풀 대학교의 앤디 쿠퍼 교수는 "이 모델은 결정 내에서 가장 특징적인 패턴과, 이 패턴이 실제 특성과 어떻게 연관되는지 학습했다"며, 소재 혁신을 위한 강력한 도구임을 강조했다.