UMA: A Family of Universal Models for Atoms - 专知论文

会员服务 ·

0

UMA · 原子 · 原子模型 · 精度 · 结构 ·

UMA: A Family of Universal Models for Atoms

翻译：UMA：通用原子模型系列

Brandon M. Wood,Misko Dzamba,Xiang Fu,Meng Gao,Muhammed Shuaibi,Luis Barroso-Luque,Kareem Abdelmaqsoud,Vahe Gharakhanyan,John R. Kitchin,Daniel S. Levine,Kyle Michel,Anuroop Sriram,Taco Cohen,Abhishek Das,Ammar Rizvi,Sushree Jagriti Sahoo,Zachary W. Ulissi,C. Lawrence Zitnick

from arxiv, 33 pages, 8 figures

The ability to quickly and accurately compute properties from atomic simulations is critical for advancing a large number of applications in chemistry and materials science including drug discovery, energy storage, and semiconductor manufacturing. To address this need, Meta FAIR presents a family of Universal Models for Atoms (UMA), designed to push the frontier of speed, accuracy, and generalization. UMA models are trained on half a billion unique 3D atomic structures (the largest training runs to date) by compiling data across multiple chemical domains, e.g. molecules, materials, and catalysts. We develop empirical scaling laws to help understand how to increase model capacity alongside dataset size to achieve the best accuracy. The UMA small and medium models utilize a novel architectural design we refer to as mixture of linear experts that enables increasing model capacity without sacrificing speed. For example, UMA-medium has 1.4B parameters but only ~50M active parameters per atomic structure. We evaluate UMA models on a diverse set of applications across multiple domains and find that, remarkably, a single model without any fine-tuning can perform similarly or better than specialized models. We are releasing the UMA code, weights, and associated data to accelerate computational workflows and enable the community to continue to build increasingly capable AI models.

翻译：快速精确地计算原子模拟性质的能力对于推动化学和材料科学领域大量应用的发展至关重要，包括药物发现、能量存储和半导体制造。为满足这一需求，Meta FAIR提出了通用原子模型系列（UMA），旨在突破速度、精度与泛化能力的前沿边界。UMA模型通过整合分子、材料、催化剂等多个化学领域的数据，在五亿个独特的3D原子结构（迄今最大规模的训练数据集）上进行训练。我们建立了经验缩放定律，以帮助理解如何同步提升模型容量与数据集规模来实现最佳精度。UMA小型与中型模型采用了一种新颖的架构设计——线性专家混合机制，该设计能在不牺牲速度的前提下提升模型容量。例如，UMA-medium模型虽拥有14亿参数，但每个原子结构仅激活约5000万参数。我们在跨多个领域的多样化应用场景中对UMA模型进行评估，发现值得注意的是，未经任何微调的单一模型能够达到甚至超越专用模型的性能。我们将公开UMA的代码、权重及相关数据，以加速计算工作流程，并推动学界持续构建能力更强的人工智能模型。

0

相关内容

UMA

《图Mamba》最新综述，探索图学习中的状态空间模型

《图Mamba》最新综述，探索图学习中的状态空间模型

专知会员服务

31+阅读 · 2024年12月26日

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

专知会员服务

29+阅读 · 2024年10月4日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

Sora是世界模拟器吗? 世界模型及其以后的综述

Sora是世界模拟器吗? 世界模型及其以后的综述

专知会员服务

41+阅读 · 2024年5月9日

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

专知会员服务

30+阅读 · 2023年6月18日

AI-6G与元宇宙？爱尔兰东理最新《人工智能和6G与元宇宙:基本原理、挑战和未来研究趋势》综述，39页pdf涵盖263篇文献

AI-6G与元宇宙？爱尔兰东理最新《人工智能和6G与元宇宙:基本原理、挑战和未来研究趋势》综述，39页pdf涵盖263篇文献

专知会员服务

60+阅读 · 2022年8月25日

分子表示如何用图学习？圣母大学等《图分子表示学习》最新简明综述，表述方法、数据集、应用等

分子表示如何用图学习？圣母大学等《图分子表示学习》最新简明综述，表述方法、数据集、应用等

专知会员服务

27+阅读 · 2022年7月12日

【西安交大等】元宇宙综述:基本原理、安全性和隐私性，A Survey on Metaverse: Fundamentals, Security, and Privacy

【西安交大等】元宇宙综述:基本原理、安全性和隐私性，A Survey on Metaverse: Fundamentals, Security, and Privacy

专知会员服务

45+阅读 · 2022年3月8日

71页PDF，Intro to the Metaverse（元宇宙概念发展透析），Newzoo Trend Report 2021

71页PDF，Intro to the Metaverse（元宇宙概念发展透析），Newzoo Trend Report 2021

专知会员服务

22+阅读 · 2022年2月19日

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

专知会员服务

28+阅读 · 2020年2月20日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

24+阅读 · 2022年10月24日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

最近必读的六篇【Meta-Learning（元学习）】相关论文和代码

最近必读的六篇【Meta-Learning（元学习）】相关论文和代码

专知

61+阅读 · 2019年11月3日

近期必读的八篇【Meta-Learning（元学习）】相关论文和代码

近期必读的八篇【Meta-Learning（元学习）】相关论文和代码

专知

134+阅读 · 2019年9月15日

元学习（Meta Learning）最全论文、视频、书籍资源整理

元学习（Meta Learning）最全论文、视频、书籍资源整理

深度学习与NLP

22+阅读 · 2019年6月20日

【资源推荐】元学习（meta-learning）相关文献资源大列表

【资源推荐】元学习（meta-learning）相关文献资源大列表

专知

25+阅读 · 2019年3月6日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

供体-超原子受体（D-SA）超原子化物及其非线性光学性质的研究

国家自然科学基金

0+阅读 · 2016年12月31日

石墨烯等离子体激元纳米器件的宏观电磁模型及其高效计算方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

开放原子-光力学系统中的量子关联

国家自然科学基金

0+阅读 · 2015年12月31日

UXT 在发育中的新功能以及相关作用机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维晶格动力学的准确数值界面条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于压电模式原子力显微技术的铁电材料纳米尺度非线性动力学研究

国家自然科学基金

0+阅读 · 2015年12月31日

光频标的原子分子结构和精密光谱的相对论计算

国家自然科学基金

0+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

玻色凝聚原子在宇称-时间对称势中的多体量子动力学

国家自然科学基金

0+阅读 · 2014年12月31日

冷原子量子态的超快操控研究

国家自然科学基金

0+阅读 · 2014年12月31日

Foundation Models for Discovery and Exploration in Chemical Space

Arxiv

0+阅读 · 5月1日

Agentic Fusion of Large Atomic and Language Models to Accelerate Superconductors Discovery

Arxiv

0+阅读 · 4月29日

ATOM: A Pretrained Neural Operator for Multitask Molecular Dynamics

Arxiv

0+阅读 · 4月23日

Breaking the Training Barrier of Billion-Parameter Universal Machine Learning Interatomic Potentials

Arxiv

0+阅读 · 4月17日

ChemDFM-R: A Chemical Reasoning LLM Enhanced with Atomized Chemical Knowledge

Arxiv

0+阅读 · 4月14日

U-CECE: A Universal Multi-Resolution Framework for Conceptual Counterfactual Explanations

Arxiv

0+阅读 · 4月9日

Mambalaya: Einsum-Based Fusion Optimizations on State-Space Models

Arxiv

0+阅读 · 4月4日

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Arxiv

0+阅读 · 3月26日

SOMA: Unifying Parametric Human Body Models

Arxiv

0+阅读 · 3月17日

InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing

Arxiv

0+阅读 · 3月10日

VIP会员

文章信息

相关主题

最新内容

【博士论文】抽象信息论与安全奖励学习的数学发展

【博士论文】抽象信息论与安全奖励学习的数学发展

专知会员服务

2+阅读 · 6月3日

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

专知会员服务

1+阅读 · 6月3日

《推进军事决策支持：运用强化学习驱动仿真的稳健作战计划验证》

《推进军事决策支持：运用强化学习驱动仿真的稳健作战计划验证》

专知会员服务

6+阅读 · 6月3日

详解人工智能赋能战争的旗舰软件平台：Maven智能系统

详解人工智能赋能战争的旗舰软件平台：Maven智能系统

专知会员服务

9+阅读 · 6月3日

《发展用于决策支持的化生放核（CBRN）态势理解》

《发展用于决策支持的化生放核（CBRN）态势理解》

专知会员服务

6+阅读 · 6月3日

《通往人工通用智能之路上的均衡策略》

《通往人工通用智能之路上的均衡策略》

专知会员服务

4+阅读 · 6月3日

《人工智能与军事整合：现状与未来风险》报告

《人工智能与军事整合：现状与未来风险》报告

专知会员服务

4+阅读 · 6月3日

《Palantir的科技生态系统》

《Palantir的科技生态系统》

专知会员服务

14+阅读 · 6月2日

《脑机接口：拓展神经前沿及其战略意涵》最新报告

《脑机接口：拓展神经前沿及其战略意涵》最新报告

专知会员服务

8+阅读 · 6月2日

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

专知会员服务

20+阅读 · 6月2日

《反无人机系统传感器融合》90页报告

《反无人机系统传感器融合》90页报告

专知会员服务

16+阅读 · 6月2日

运用人工智能与卫星通信驱散“战争迷雾”

运用人工智能与卫星通信驱散“战争迷雾”

专知会员服务

8+阅读 · 6月2日

ACL 2026 | LLMSurgeon：从生成文本诊断大模型训练数据

ACL 2026 | LLMSurgeon：从生成文本诊断大模型训练数据

专知会员服务

7+阅读 · 6月2日

【综述】世界模型：架构、方法、推理与应用全景

【综述】世界模型：架构、方法、推理与应用全景

专知会员服务

12+阅读 · 6月2日

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

专知会员服务

8+阅读 · 6月1日

相关VIP内容

《图Mamba》最新综述，探索图学习中的状态空间模型

《图Mamba》最新综述，探索图学习中的状态空间模型

专知会员服务

31+阅读 · 2024年12月26日

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

专知会员服务

29+阅读 · 2024年10月4日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

Sora是世界模拟器吗? 世界模型及其以后的综述

Sora是世界模拟器吗? 世界模型及其以后的综述

专知会员服务

41+阅读 · 2024年5月9日

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

专知会员服务

30+阅读 · 2023年6月18日

AI-6G与元宇宙？爱尔兰东理最新《人工智能和6G与元宇宙:基本原理、挑战和未来研究趋势》综述，39页pdf涵盖263篇文献

AI-6G与元宇宙？爱尔兰东理最新《人工智能和6G与元宇宙:基本原理、挑战和未来研究趋势》综述，39页pdf涵盖263篇文献

专知会员服务

60+阅读 · 2022年8月25日

分子表示如何用图学习？圣母大学等《图分子表示学习》最新简明综述，表述方法、数据集、应用等

分子表示如何用图学习？圣母大学等《图分子表示学习》最新简明综述，表述方法、数据集、应用等

专知会员服务

27+阅读 · 2022年7月12日

【西安交大等】元宇宙综述:基本原理、安全性和隐私性，A Survey on Metaverse: Fundamentals, Security, and Privacy

【西安交大等】元宇宙综述:基本原理、安全性和隐私性，A Survey on Metaverse: Fundamentals, Security, and Privacy

专知会员服务

45+阅读 · 2022年3月8日

71页PDF，Intro to the Metaverse（元宇宙概念发展透析），Newzoo Trend Report 2021

71页PDF，Intro to the Metaverse（元宇宙概念发展透析），Newzoo Trend Report 2021

专知会员服务

22+阅读 · 2022年2月19日

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

专知会员服务

28+阅读 · 2020年2月20日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

详解人工智能赋能战争的旗舰软件平台：Maven智能系统

【博士论文】抽象信息论与安全奖励学习的数学发展

《推进军事决策支持：运用强化学习驱动仿真的稳健作战计划验证》

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

24+阅读 · 2022年10月24日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

【伯克利马毅老师等重磅新书】低维模型进行高维数据分析:原理、计算和应用，710页pdf

专知

45+阅读 · 2020年12月9日

最近必读的六篇【Meta-Learning（元学习）】相关论文和代码

最近必读的六篇【Meta-Learning（元学习）】相关论文和代码

专知

61+阅读 · 2019年11月3日

近期必读的八篇【Meta-Learning（元学习）】相关论文和代码

近期必读的八篇【Meta-Learning（元学习）】相关论文和代码

专知

134+阅读 · 2019年9月15日

元学习（Meta Learning）最全论文、视频、书籍资源整理

元学习（Meta Learning）最全论文、视频、书籍资源整理

深度学习与NLP

22+阅读 · 2019年6月20日

【资源推荐】元学习（meta-learning）相关文献资源大列表

【资源推荐】元学习（meta-learning）相关文献资源大列表

专知

25+阅读 · 2019年3月6日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

相关论文

Foundation Models for Discovery and Exploration in Chemical Space

Arxiv

0+阅读 · 5月1日

Agentic Fusion of Large Atomic and Language Models to Accelerate Superconductors Discovery

Arxiv

0+阅读 · 4月29日

ATOM: A Pretrained Neural Operator for Multitask Molecular Dynamics

Arxiv

0+阅读 · 4月23日

Breaking the Training Barrier of Billion-Parameter Universal Machine Learning Interatomic Potentials

Arxiv

0+阅读 · 4月17日

ChemDFM-R: A Chemical Reasoning LLM Enhanced with Atomized Chemical Knowledge

Arxiv

0+阅读 · 4月14日

U-CECE: A Universal Multi-Resolution Framework for Conceptual Counterfactual Explanations

Arxiv

0+阅读 · 4月9日

Mambalaya: Einsum-Based Fusion Optimizations on State-Space Models

Arxiv

0+阅读 · 4月4日

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Arxiv

0+阅读 · 3月26日

SOMA: Unifying Parametric Human Body Models

Arxiv

0+阅读 · 3月17日

InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing

Arxiv

0+阅读 · 3月10日

相关基金

供体-超原子受体（D-SA）超原子化物及其非线性光学性质的研究

国家自然科学基金

0+阅读 · 2016年12月31日

石墨烯等离子体激元纳米器件的宏观电磁模型及其高效计算方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

开放原子-光力学系统中的量子关联

国家自然科学基金

0+阅读 · 2015年12月31日

UXT 在发育中的新功能以及相关作用机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维晶格动力学的准确数值界面条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于压电模式原子力显微技术的铁电材料纳米尺度非线性动力学研究

国家自然科学基金

0+阅读 · 2015年12月31日

光频标的原子分子结构和精密光谱的相对论计算

国家自然科学基金

0+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

玻色凝聚原子在宇称-时间对称势中的多体量子动力学

国家自然科学基金

0+阅读 · 2014年12月31日

冷原子量子态的超快操控研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员