Benchmarking Compositional Generalisation for Machine Learning Interatomic Potentials - 专知论文

会员服务 ·

0

Learning · MoDELS · Machine Learning · 样例 · 动力学模拟 ·

Benchmarking Compositional Generalisation for Machine Learning Interatomic Potentials

翻译：机器学习原子间势的组成泛化能力基准测试

Amir Masoud Nourollah,Irtaza Khalid,Stefano Leoni,Steven Schockaert

Machine Learning Interatomic Potentials play a fundamental role in computational chemistry and materials science, enabling applications from molecular dynamics simulations to drug design and materials discovery. While recent approaches can estimate inter-atomic forces with high precision, it remains unclear to what extent they can generalise to previously unseen molecules. Do they learn the compositional structure of chemistry, capturing how molecular fragments and their combinations determine properties, or do they primarily learn to interpolate patterns that are specific to the training examples? To address this question, we propose a benchmark consisting of four tasks that require some form of compositional generalisation. In each task, models are tested on molecules that were unseen during training, but the training data is chosen such that generalisation to the test examples should be feasible for models that learn the underlying physical principles. Our empirical analysis shows that the considered tasks are highly challenging for state-of-the-art models, with errors on out-of-distribution examples often an order of magnitude higher than on in-distribution examples, even when using foundation models that have been pre-trained on millions of molecules.

翻译：机器学习原子间势在计算化学和材料科学中发挥着基础性作用，其应用涵盖从分子动力学模拟到药物设计和材料发现。尽管近期方法能够高精度估计原子间作用力，但其在多大程度上能泛化到未见过的分子仍不明确：这些方法究竟是学习了化学的组成结构，理解分子片段及其组合如何决定性质，还是主要学习插值训练样本特有的模式？为探究此问题，我们提出了一个由四项任务组成的基准测试，每项任务都需要某种形式的组成泛化能力。在每项任务中，模型需对训练期间未出现的分子进行测试，但训练数据经过精心选择——若能学习底层物理原理，模型应能从训练示例泛化到测试样本。实证分析表明，这些任务对当前最先进模型极具挑战性：即使在预训练于数百万分子的基础模型上，分布外样本的误差也常比分布内样本高出一个数量级。

0

相关内容

Learning

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

专知会员服务

25+阅读 · 1月16日

【阿姆斯特丹博士论文】在测试时学习泛化

【阿姆斯特丹博士论文】在测试时学习泛化

专知会员服务

13+阅读 · 2025年7月16日

量子机器学习的基础和应用：一个简明文献综述

量子机器学习的基础和应用：一个简明文献综述

专知会员服务

40+阅读 · 2022年6月28日

【干货书】机器学习优化，509页pdf

【干货书】机器学习优化，509页pdf

专知会员服务

150+阅读 · 2021年2月26日

机器学习组合优化

机器学习组合优化

专知会员服务

112+阅读 · 2021年2月16日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

最新《机器学习最优化》课程笔记，36页pdf，Optimization for Machine Learning

专知会员服务

173+阅读 · 2020年5月10日

【斯坦福】机器学习优化简明导论， Introduction to Optimization for Machine Learning

【斯坦福】机器学习优化简明导论， Introduction to Optimization for Machine Learning

专知会员服务

93+阅读 · 2020年5月6日

【机器学习最优化课程笔记】Optimization for Machine Learning，36页pdf

【机器学习最优化课程笔记】Optimization for Machine Learning，36页pdf

专知会员服务

117+阅读 · 2020年3月25日

【BAAI|2019】用深度学习模拟原子间势，王涵（附pdf）

【BAAI|2019】用深度学习模拟原子间势，王涵（附pdf）

专知会员服务

18+阅读 · 2019年11月21日

【2022新书】知识表示和机器学习的预测和分析，232页pdf

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

【2022新书】机器学习基础，225页pdf，Machine Learning The Basics

【2022新书】机器学习基础，225页pdf，Machine Learning The Basics

专知

13+阅读 · 2022年1月27日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

【资源推荐】Machine Learning基础学习资源汇总

【资源推荐】Machine Learning基础学习资源汇总

专知

31+阅读 · 2019年5月29日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

机器学习笔试题精选

机器学习笔试题精选

人工智能头条

13+阅读 · 2018年7月22日

机器学习必备手册

机器学习必备手册

机器学习研究会

20+阅读 · 2017年10月24日

从浅层模型到深度模型：概览机器学习优化算法

从浅层模型到深度模型：概览机器学习优化算法

机器之心

27+阅读 · 2017年7月9日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

高维晶格动力学的准确数值界面条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

Conformalized Quantum DeepONet Ensembles for Scalable Operator Learning with Distribution-Free Uncertainty

Arxiv

0+阅读 · 6月15日

Physics-Informed Attention Mechanism and Generalization Capability of Deep Learning-Based Grain Growth Evolution Prediction

Arxiv

0+阅读 · 6月15日

ATOM-Bench: A Real-World Benchmark for Atomic Skills and Compositional Generalization in Manipulation Policies

Arxiv

0+阅读 · 6月15日

Enhancing Quantum Machine Learning with Anyons

Arxiv

0+阅读 · 6月15日

Scalar-pathway fidelity improves physical accuracy in short-range equivariant interatomic potentials

Arxiv

0+阅读 · 6月14日

Thermodynamic assessment of machine learning models for solid-state synthesis prediction

Arxiv

0+阅读 · 6月11日

Instrumented data for causal scientific machine learning

Arxiv

0+阅读 · 6月5日

Pushing the limits of unconstrained machine-learned interatomic potentials

Arxiv

0+阅读 · 6月4日

Identifiability and Inference for Generalized Latent Factor Models

Arxiv

0+阅读 · 6月2日

GraphBench: Next-generation graph learning benchmarking

Arxiv

0+阅读 · 5月9日

VIP会员

文章信息

相关主题

Machine Learning

动力学模拟

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

专知会员服务

25+阅读 · 1月16日

【阿姆斯特丹博士论文】在测试时学习泛化

【阿姆斯特丹博士论文】在测试时学习泛化

专知会员服务

13+阅读 · 2025年7月16日

量子机器学习的基础和应用：一个简明文献综述

量子机器学习的基础和应用：一个简明文献综述

专知会员服务

40+阅读 · 2022年6月28日

【干货书】机器学习优化，509页pdf

【干货书】机器学习优化，509页pdf

专知会员服务

150+阅读 · 2021年2月26日

机器学习组合优化

机器学习组合优化

专知会员服务

112+阅读 · 2021年2月16日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

最新《机器学习最优化》课程笔记，36页pdf，Optimization for Machine Learning

专知会员服务

173+阅读 · 2020年5月10日

【斯坦福】机器学习优化简明导论， Introduction to Optimization for Machine Learning

【斯坦福】机器学习优化简明导论， Introduction to Optimization for Machine Learning

专知会员服务

93+阅读 · 2020年5月6日

【机器学习最优化课程笔记】Optimization for Machine Learning，36页pdf

【机器学习最优化课程笔记】Optimization for Machine Learning，36页pdf

专知会员服务

117+阅读 · 2020年3月25日

【BAAI|2019】用深度学习模拟原子间势，王涵（附pdf）

【BAAI|2019】用深度学习模拟原子间势，王涵（附pdf）

专知会员服务

18+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

【2022新书】知识表示和机器学习的预测和分析，232页pdf

【2022新书】知识表示和机器学习的预测和分析，232页pdf

专知

41+阅读 · 2022年3月12日

【2022新书】机器学习基础，225页pdf，Machine Learning The Basics

【2022新书】机器学习基础，225页pdf，Machine Learning The Basics

专知

13+阅读 · 2022年1月27日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

【资源推荐】Machine Learning基础学习资源汇总

【资源推荐】Machine Learning基础学习资源汇总

专知

31+阅读 · 2019年5月29日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

机器学习笔试题精选

机器学习笔试题精选

人工智能头条

13+阅读 · 2018年7月22日

机器学习必备手册

机器学习必备手册

机器学习研究会

20+阅读 · 2017年10月24日

从浅层模型到深度模型：概览机器学习优化算法

从浅层模型到深度模型：概览机器学习优化算法

机器之心

27+阅读 · 2017年7月9日

相关论文

Conformalized Quantum DeepONet Ensembles for Scalable Operator Learning with Distribution-Free Uncertainty

Arxiv

0+阅读 · 6月15日

Physics-Informed Attention Mechanism and Generalization Capability of Deep Learning-Based Grain Growth Evolution Prediction

Arxiv

0+阅读 · 6月15日

ATOM-Bench: A Real-World Benchmark for Atomic Skills and Compositional Generalization in Manipulation Policies

Arxiv

0+阅读 · 6月15日

Enhancing Quantum Machine Learning with Anyons

Arxiv

0+阅读 · 6月15日

Scalar-pathway fidelity improves physical accuracy in short-range equivariant interatomic potentials

Arxiv

0+阅读 · 6月14日

Thermodynamic assessment of machine learning models for solid-state synthesis prediction

Arxiv

0+阅读 · 6月11日

Instrumented data for causal scientific machine learning

Arxiv

0+阅读 · 6月5日

Pushing the limits of unconstrained machine-learned interatomic potentials

Arxiv

0+阅读 · 6月4日

Identifiability and Inference for Generalized Latent Factor Models

Arxiv

0+阅读 · 6月2日

GraphBench: Next-generation graph learning benchmarking

Arxiv

0+阅读 · 5月9日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

高维晶格动力学的准确数值界面条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员