Meta重磅!OMol25数据集与UMA模型引领化学研究新篇章

   发布时间:2025-05-16 10:18 作者:沈瑾瑜

meta AI公司近期在化学研究领域迈出了重要一步,携手美国能源部劳伦斯伯克利国家实验室,共同推出了一个前所未有的化学数据集——Open Molecules 2025(简称OMol25),以及一款通用原子模型Universal Models for Atoms(简称UMA)。

OMol25数据集堪称化学研究的新里程碑,其规模之庞大,前所未见。该数据集包含了超过1亿个基于密度泛函理论(DFT)计算得出的3D分子快照,为科学家提供了丰富的分子模拟资源。DFT作为一种强大的模拟工具,能够精确捕捉原子间的相互作用,预测原子受力及系统能量,进而揭示分子运动和化学反应的深层规律。

然而,传统的DFT计算对计算资源的需求极为庞大,随着分子复杂度的提升,计算需求呈指数级增长,即便是最先进的计算设备也难以应对。为了克服这一难题,meta AI利用OMol25数据集训练了机器学习原子间势(MLIPs),这种模型能够以快至万倍的速度提供与DFT同等精度的预测结果,使得科学家能够在普通计算系统上模拟大型原子系统。

除了OMol25数据集外,meta AI还推出了UMA模型,这是一款基于过去五年meta FAIR公开数据集构建的通用原子间势能模型群。UMA覆盖了分子、材料、触媒等多个化学领域,利用超过50亿个原子组成的3D结构作为训练数据,具有极高的通用性和预测精度。

UMA模型分为UMA-small和UMA-medium两种规模,其中UMA-medium模型拥有14亿参数,但单结构计算仅用约5000万参数,大大提高了推理速度。UMA模型无需微调,仅通过预训练即可应对多种化学任务,其性能甚至超越了现有的专用模型。

研究表明,UMA在分子特性预测、材料设计、触媒开发、能量存储及半导体制造等领域均表现出色。其高精度与快速计算能力为科学研究和工业应用开辟了新的路径,推动了跨领域的技术革新。这一成果的发布,无疑将为化学研究注入新的活力,促进化学领域的快速发展。

 
 
更多>同类内容
全站最新
热门内容
本栏最新