Active Learning Strategies for Efficient Machine-Learned Interatomic Potentials Across Diverse Material Systems - 专知论文

会员服务 ·

0

系统 · 原子 · 主动学习 · 学习策略 · 集成 ·

Active Learning Strategies for Efficient Machine-Learned Interatomic Potentials Across Diverse Material Systems

翻译：面向多样化材料系统的高效机器学习原子间势能主动学习策略

Mohammed Azeez Khan,Aaron D'Souza,Vijay Choyal

from arxiv, 14 pages, 3 figures, 2 tables

Efficient materials discovery requires reducing costly first-principles calculations for training machine-learned interatomic potentials (MLIPs). We develop an active learning (AL) framework that iteratively selects informative structures from the Materials Project and Open Quantum Materials Database (OQMD) using compositional and property-based descriptors with a neural network ensemble model. Query-by-Committee enables real-time uncertainty quantification. We compare four strategies: random sampling (baseline), uncertainty-based sampling, diversity-based sampling (k-means clustering with farthest-point refinement), and a hybrid approach. Experiments across four material systems (C, Si, Fe, and TiO2) with 5 random seeds demonstrate that diversity sampling achieves competitive or superior performance, with 10.9% improvement on TiO2. Our approach achieves equivalent accuracy with 5-13% fewer labeled samples than random baselines. The complete pipeline executes on Google Colab in under 4 hours per system using less than 8 GB RAM, democratizing MLIP development for resource-limited researchers. Open-source code and configurations are available on GitHub. This multi-system evaluation provides practical guidelines for data-efficient MLIP training and highlights integration with symmetry-aware architectures as a promising future direction.

翻译：高效的材料发现需要减少用于训练机器学习原子间势能（MLIPs）的高成本第一性原理计算。我们开发了一个主动学习（AL）框架，该框架利用基于成分和性质的描述符，结合神经网络集成模型，从Materials Project和开放量子材料数据库（OQMD）中迭代选择信息丰富的结构。委员会查询（Query-by-Committee）方法实现了实时不确定性量化。我们比较了四种策略：随机采样（基线）、基于不确定性的采样、基于多样性的采样（采用最远点优化的k-means聚类）以及混合方法。在四种材料系统（C、Si、Fe和TiO2）上使用5个随机种子进行的实验表明，多样性采样取得了具有竞争力或更优的性能，在TiO2上实现了10.9%的改进。我们的方法在达到同等精度时，比随机基线少用5-13%的标记样本。完整的流程在Google Colab上执行，每个系统耗时不到4小时且使用少于8 GB内存，为资源有限的研究人员普及了MLIP开发。开源代码和配置已在GitHub上提供。这项多系统评估为数据高效的MLIP训练提供了实用指南，并强调了与对称性感知架构的集成是一个有前景的未来方向。

0

相关内容

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

专知会员服务

25+阅读 · 1月16日

【Nature Machine Intelligence】大规模多智能体系统的高效强化学习

【Nature Machine Intelligence】大规模多智能体系统的高效强化学习

专知会员服务

46+阅读 · 2024年9月7日

【博士论文】面向边缘智能的高效微型机器学习系统，212页pdf

【博士论文】面向边缘智能的高效微型机器学习系统，212页pdf

专知会员服务

60+阅读 · 2024年2月25日

《数据高效的主动机器学习》美国空军2022最新页技术总结报告

《数据高效的主动机器学习》美国空军2022最新页技术总结报告

专知会员服务

43+阅读 · 2022年10月30日

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

专知会员服务

48+阅读 · 2022年9月9日

推荐！【npj 计算材料学】《深度学习方法在材料科学中的最新进展和应用》26页最新综述论文，含材料科学和工程深度学习应用中使用的软件包和数据库

推荐！【npj 计算材料学】《深度学习方法在材料科学中的最新进展和应用》26页最新综述论文，含材料科学和工程深度学习应用中使用的软件包和数据库

专知会员服务

24+阅读 · 2022年6月28日

【经典书】高效机器学习，Efficient Learning Machines，263页pdf

【经典书】高效机器学习，Efficient Learning Machines，263页pdf

专知会员服务

69+阅读 · 2022年4月11日

【AI+新材料】MIT学者利用计算建模指导新材料的开发，Using Machine Learning and Data Mining to Leverage Community Knowledge for the Engineering of Stable Metal–Organic Frameworks

【AI+新材料】MIT学者利用计算建模指导新材料的开发，Using Machine Learning and Data Mining to Leverage Community Knowledge for the Engineering of Stable Metal–Organic Frameworks

专知会员服务

25+阅读 · 2022年3月13日

机器学习技术在材料科学领域中的应用进展

专知会员服务

44+阅读 · 2021年9月7日

西北大学等最新《深度主动学习》全面综述论文，30页pdf

西北大学等最新《深度主动学习》全面综述论文，30页pdf

专知会员服务

112+阅读 · 2020年9月4日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

16+阅读 · 2020年9月9日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

最近必读的六篇【Meta-Learning（元学习）】相关论文和代码

最近必读的六篇【Meta-Learning（元学习）】相关论文和代码

专知

61+阅读 · 2019年11月3日

【资源推荐】元学习（meta-learning）相关文献资源大列表

【资源推荐】元学习（meta-learning）相关文献资源大列表

专知

25+阅读 · 2019年3月6日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于酰腙多重刺激响应动态共价聚合物材料的设计合成、组装及分子识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Learning to Select Like Humans: Explainable Active Learning for Medical Imaging

Arxiv

0+阅读 · 2月17日

From Evaluation to Design: Using Potential Energy Surface Smoothness Metrics to Guide Machine Learning Interatomic Potential Architectures

Arxiv

0+阅读 · 2月4日

Active Transfer Bagging: A New Approach for Accelerated Active Learning Acquisition of Data by Combined Transfer Learning and Bagging Based Models

Arxiv

0+阅读 · 2月2日

Enabling AI Deep Potentials for Ab Initio-quality Molecular Dynamics Simulations in GROMACS

Arxiv

0+阅读 · 2月2日

DistMLIP: A Distributed Inference Platform for Machine Learning Interatomic Potentials

Arxiv

0+阅读 · 1月31日

ALER: An Active Learning Hybrid System for Efficient Entity Resolution

Arxiv

0+阅读 · 1月28日

Optimising for Energy Efficiency and Performance in Machine Learning

Arxiv

0+阅读 · 1月22日

Pushing the limits of unconstrained machine-learned interatomic potentials

Arxiv

0+阅读 · 1月22日

Performance-guided Reinforced Active Learning for Object Detection

Arxiv

0+阅读 · 1月22日

Optimising for Energy Efficiency and Performance in Machine Learning

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

最新内容

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

专知会员服务

0+阅读 · 今天14:48

博士论文 | 从算法到基础模型：强化学习的统一视角

博士论文 | 从算法到基础模型：强化学习的统一视角

专知会员服务

0+阅读 · 今天14:46

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

4+阅读 · 今天8:04

《异构人类团队的协作决策过程混合建模研究》

《异构人类团队的协作决策过程混合建模研究》

专知会员服务

4+阅读 · 今天7:59

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

专知会员服务

4+阅读 · 今天7:56

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

专知会员服务

4+阅读 · 今天7:50

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

4+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

6+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

13+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

7+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

7+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

5+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

11+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

7+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

10+阅读 · 7月26日

相关VIP内容

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

专知会员服务

25+阅读 · 1月16日

【Nature Machine Intelligence】大规模多智能体系统的高效强化学习

【Nature Machine Intelligence】大规模多智能体系统的高效强化学习

专知会员服务

46+阅读 · 2024年9月7日

【博士论文】面向边缘智能的高效微型机器学习系统，212页pdf

【博士论文】面向边缘智能的高效微型机器学习系统，212页pdf

专知会员服务

60+阅读 · 2024年2月25日

《数据高效的主动机器学习》美国空军2022最新页技术总结报告

《数据高效的主动机器学习》美国空军2022最新页技术总结报告

专知会员服务

43+阅读 · 2022年10月30日

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

专知会员服务

48+阅读 · 2022年9月9日

推荐！【npj 计算材料学】《深度学习方法在材料科学中的最新进展和应用》26页最新综述论文，含材料科学和工程深度学习应用中使用的软件包和数据库

推荐！【npj 计算材料学】《深度学习方法在材料科学中的最新进展和应用》26页最新综述论文，含材料科学和工程深度学习应用中使用的软件包和数据库

专知会员服务

24+阅读 · 2022年6月28日

【经典书】高效机器学习，Efficient Learning Machines，263页pdf

【经典书】高效机器学习，Efficient Learning Machines，263页pdf

专知会员服务

69+阅读 · 2022年4月11日

【AI+新材料】MIT学者利用计算建模指导新材料的开发，Using Machine Learning and Data Mining to Leverage Community Knowledge for the Engineering of Stable Metal–Organic Frameworks

【AI+新材料】MIT学者利用计算建模指导新材料的开发，Using Machine Learning and Data Mining to Leverage Community Knowledge for the Engineering of Stable Metal–Organic Frameworks

专知会员服务

25+阅读 · 2022年3月13日

机器学习技术在材料科学领域中的应用进展

专知会员服务

44+阅读 · 2021年9月7日

西北大学等最新《深度主动学习》全面综述论文，30页pdf

西北大学等最新《深度主动学习》全面综述论文，30页pdf

专知会员服务

112+阅读 · 2020年9月4日

热门VIP内容

开通专知VIP会员享更多权益服务

博士论文 | 从算法到基础模型：强化学习的统一视角

《异构人类团队的协作决策过程混合建模研究》

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

面向国防作战的最佳自主与蜂群无人机技术

相关资讯

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

16+阅读 · 2020年9月9日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

最近必读的六篇【Meta-Learning（元学习）】相关论文和代码

最近必读的六篇【Meta-Learning（元学习）】相关论文和代码

专知

61+阅读 · 2019年11月3日

【资源推荐】元学习（meta-learning）相关文献资源大列表

【资源推荐】元学习（meta-learning）相关文献资源大列表

专知

25+阅读 · 2019年3月6日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

相关论文

Learning to Select Like Humans: Explainable Active Learning for Medical Imaging

Arxiv

0+阅读 · 2月17日

From Evaluation to Design: Using Potential Energy Surface Smoothness Metrics to Guide Machine Learning Interatomic Potential Architectures

Arxiv

0+阅读 · 2月4日

Active Transfer Bagging: A New Approach for Accelerated Active Learning Acquisition of Data by Combined Transfer Learning and Bagging Based Models

Arxiv

0+阅读 · 2月2日

Enabling AI Deep Potentials for Ab Initio-quality Molecular Dynamics Simulations in GROMACS

Arxiv

0+阅读 · 2月2日

DistMLIP: A Distributed Inference Platform for Machine Learning Interatomic Potentials

Arxiv

0+阅读 · 1月31日

ALER: An Active Learning Hybrid System for Efficient Entity Resolution

Arxiv

0+阅读 · 1月28日

Optimising for Energy Efficiency and Performance in Machine Learning

Arxiv

0+阅读 · 1月22日

Pushing the limits of unconstrained machine-learned interatomic potentials

Arxiv

0+阅读 · 1月22日

Performance-guided Reinforced Active Learning for Object Detection

Arxiv

0+阅读 · 1月22日

Optimising for Energy Efficiency and Performance in Machine Learning

Arxiv

0+阅读 · 1月13日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于酰腙多重刺激响应动态共价聚合物材料的设计合成、组装及分子识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员