英国研究人员开发出了一款强大的新型AI工具,有望彻底改变科学家发现和设计新材料的方式。
利物浦大学与南安普顿大学的团队共同发布了CrystalGPT,官方名称为基于Transformer的分子晶体表示模型(MCRT)。该模型以Cambridge Structural Database中的706,126个实验晶体结构为基础进行预训练,使其能够自学分子晶体的复杂“语言”。
CrystalGPT的独特之处在于其双重表示方法。该模型将基于图的原子键分析与拓扑成像能力相结合,使其能够同时处理分子结构的细节和更广泛的结构模式。这种多模态方法让AI能够在微观和宏观层面对晶体属性形成全面理解。
“我们设计MCRT作为一个基础模型,即使只有少量可用数据,也能轻松针对具体问题进行微调。”利物浦大学团队成员Xenophon Evangelopoulos解释道。这种在数据有限情况下依然高效工作的能力,在化学领域尤为宝贵,因为实验和计算往往耗时且成本高昂。
该模型采用四种不同的预训练任务,从晶体中提取局部和全局表示。当针对特定应用进行微调后,CrystalGPT能够仅用传统所需数据的一小部分,就以极高的准确率预测材料的关键属性,如密度、孔隙率和对称性。
这一创新对材料科学领域意义重大。传统的晶体结构与属性预测计算方法资源消耗巨大,而CrystalGPT能够绕开这些限制,有望加速医药、有机电子、蓄电池开发以及用于气体储存的多孔材料等领域的发现。正如利物浦大学的Andy Cooper教授所说,该模型“学会了这些晶体中最具代表性的结构模式”,并且“理解了这些模式与实际属性之间的关系”,使其成为材料创新的有力工具。