Comparing the latent features of universal machine-learning interatomic potentials - 专知论文

会员服务 ·

0

原子 · 潜在 · 结构 · 重构误差 · 系统 ·

Comparing the latent features of universal machine-learning interatomic potentials

翻译：通用机器学习原子间势的潜在特征比较

Sofiia Chorna,Davide Tisi,Cesare Malosso,Wei Bin How,Michele Ceriotti,Sanggyu Chong

The past few years have seen the development of ``universal'' machine-learning interatomic potentials (uMLIPs) capable of approximating the ground-state potential energy surface across a wide range of chemical structures and compositions with reasonable accuracy. While these models differ in the architecture and the dataset used, they share the ability to compress a staggering amount of chemical information into descriptive latent features. Herein, we systematically analyze what the different uMLIPs have learned by quantitatively assessing the relative information content of their latent features with feature reconstruction errors, and observing how the trends are affected by the choice of training set and training protocol. We find that uMLIPs encode the chemical space in significantly distinct ways, with substantial cross-model feature reconstruction errors. When variants of the same model architecture are considered, trends become dependent on the dataset, target, and training protocol of choice. We also observe that fine-tuning of a uMLIP retains a strong pre-training bias in the latent features. Finally, we discuss how atom-level features, which are directly output by MLIPs, can be compressed into global structure-level features via concatenation of progressive cumulants, each adding significantly new information about the variability across the atomic environments within a given system.

翻译：近年来，已发展出能够以合理精度近似描述广泛化学结构和组成范围内基态势能面的"通用"机器学习原子间势（uMLIPs）。尽管这些模型在架构和所用数据集上存在差异，但它们都具备将海量化学信息压缩为描述性潜在特征的能力。本文通过特征重构误差定量评估不同uMLIPs潜在特征的相对信息含量，并观察训练集选择与训练方案如何影响特征趋势，从而系统分析不同uMLIPs的学习成果。研究发现，uMLIPs以显著不同的方式编码化学空间，存在显著的跨模型特征重构误差。当考虑相同架构的变体时，趋势则取决于所选数据集、训练目标及训练方案。我们还观察到，uMLIPs的微调会在潜在特征中保留强烈的预训练偏好。最后，我们探讨了如何通过渐进累积量的级联，将MLIPs直接输出的原子级特征压缩为全局结构级特征，其中每个累积量都为特定系统内原子环境的变化性提供了显著的新信息。

0

相关内容

图机器学习的核心原理：表征、鲁棒性与泛化性

图机器学习的核心原理：表征、鲁棒性与泛化性

专知会员服务

22+阅读 · 2月4日

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

专知会员服务

25+阅读 · 1月16日

【普林斯顿博士论文】潜变量下的机器学习与优化，239页pdf

【普林斯顿博士论文】潜变量下的机器学习与优化，239页pdf

专知会员服务

39+阅读 · 2023年8月1日

分子表示如何用图学习？圣母大学等《图分子表示学习》最新简明综述，表述方法、数据集、应用等

分子表示如何用图学习？圣母大学等《图分子表示学习》最新简明综述，表述方法、数据集、应用等

专知会员服务

27+阅读 · 2022年7月12日

量子机器学习的基础和应用：一个简明文献综述

量子机器学习的基础和应用：一个简明文献综述

专知会员服务

39+阅读 · 2022年6月28日

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

专知会员服务

48+阅读 · 2021年12月22日

【干货书】机器学习的一阶和随机优化方法，591页pdf阐述机器学习算法基础概念和近期进展

【干货书】机器学习的一阶和随机优化方法，591页pdf阐述机器学习算法基础概念和近期进展

专知会员服务

82+阅读 · 2021年5月13日

机器学习组合优化

机器学习组合优化

专知会员服务

111+阅读 · 2021年2月16日

机器学习的可解释性

机器学习的可解释性

专知会员服务

69+阅读 · 2020年12月18日

【BAAI|2019】用深度学习模拟原子间势，王涵（附pdf）

【BAAI|2019】用深度学习模拟原子间势，王涵（附pdf）

专知会员服务

18+阅读 · 2019年11月21日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知

135+阅读 · 2020年2月15日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

博客 | 机器学习中的数学基础（凸优化）

博客 | 机器学习中的数学基础（凸优化）

AI研习社

14+阅读 · 2018年12月16日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

学界 | CVPR 2018论文解读：让神经网络学习比较来实现少样本学习

学界 | CVPR 2018论文解读：让神经网络学习比较来实现少样本学习

AI科技评论

14+阅读 · 2018年4月5日

从浅层模型到深度模型：概览机器学习优化算法

从浅层模型到深度模型：概览机器学习优化算法

机器之心

27+阅读 · 2017年7月9日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于渐进结构化学习的高维信息稀疏表示理论与技术

国家自然科学基金

0+阅读 · 2015年12月31日

基于非线性流形学习的极化SAR特征提取与匹配技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

A Theory of Feature Learning in Kernel Models

Arxiv

0+阅读 · 2月16日

From Evaluation to Design: Using Potential Energy Surface Smoothness Metrics to Guide Machine Learning Interatomic Potential Architectures

Arxiv

0+阅读 · 2月4日

Multimodal Scientific Learning Beyond Diffusions and Flows

Arxiv

0+阅读 · 2月1日

DistMLIP: A Distributed Inference Platform for Machine Learning Interatomic Potentials

Arxiv

0+阅读 · 1月31日

Over-Alignment vs Over-Fitting: The Role of Feature Learning Strength in Generalization

Arxiv

0+阅读 · 1月31日

Learning Dynamic Representations via An Optimally-Weighted Maximum Mean Discrepancy Optimization Framework for Continual Learning

Arxiv

0+阅读 · 1月27日

Pushing the limits of unconstrained machine-learned interatomic potentials

Arxiv

0+阅读 · 1月22日

Active Learning Strategies for Efficient Machine-Learned Interatomic Potentials Across Diverse Material Systems

Arxiv

0+阅读 · 1月21日

BLIPs: Bayesian Learned Interatomic Potentials

Arxiv

0+阅读 · 1月16日

Automated Machine Learning in Radiomics: A Comparative Evaluation of Performance, Efficiency and Accessibility

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

最新内容

《美国首席数字与人工智能办公室（CDAO）人工智能治理与采办流程效能评估》报告

《美国首席数字与人工智能办公室（CDAO）人工智能治理与采办流程效能评估》报告

专知会员服务

1+阅读 · 57分钟前

算法战加速推进：五角大楼项目、供应商生态体系与军事创新的战略重塑

算法战加速推进：五角大楼项目、供应商生态体系与军事创新的战略重塑

专知会员服务

0+阅读 · 今天3:23

探秘Palantir：驱动美情报的科技巨头

探秘Palantir：驱动美情报的科技巨头

专知会员服务

1+阅读 · 今天3:14

《从技术突破到战场应用：发挥原型开发效能的最佳实践》报告

《从技术突破到战场应用：发挥原型开发效能的最佳实践》报告

专知会员服务

1+阅读 · 今天3:09

《美国海军军事海运司令部 2026年手册》

《美国海军军事海运司令部 2026年手册》

专知会员服务

1+阅读 · 今天3:05

别再只盯着“杀手机器人”了：人工智能真正变革现代战争的三种方式

别再只盯着“杀手机器人”了：人工智能真正变革现代战争的三种方式

专知会员服务

0+阅读 · 今天2:36

《人工智能使能系统可靠性框架》

《人工智能使能系统可靠性框架》

专知会员服务

3+阅读 · 今天2:28

2026“人工智能+”行业发展蓝皮书（附下载）

2026“人工智能+”行业发展蓝皮书（附下载）

专知会员服务

11+阅读 · 4月26日

《强化学习数学基础》

《强化学习数学基础》

专知会员服务

7+阅读 · 4月26日

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

专知会员服务

7+阅读 · 4月26日

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

专知会员服务

6+阅读 · 4月26日

深入Maven智能系统：Palantir基于Claude打造的军事大脑

深入Maven智能系统：Palantir基于Claude打造的军事大脑

专知会员服务

12+阅读 · 4月26日

“Maven计划”的发展演变之“Maven智能系统”应用

“Maven计划”的发展演变之“Maven智能系统”应用

专知会员服务

10+阅读 · 4月26日

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

专知会员服务

7+阅读 · 4月26日

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

专知会员服务

7+阅读 · 4月26日

相关VIP内容

图机器学习的核心原理：表征、鲁棒性与泛化性

图机器学习的核心原理：表征、鲁棒性与泛化性

专知会员服务

22+阅读 · 2月4日

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

组合优化赋能的机器学习：技术基础、应用场景与研究前沿

专知会员服务

25+阅读 · 1月16日

【普林斯顿博士论文】潜变量下的机器学习与优化，239页pdf

【普林斯顿博士论文】潜变量下的机器学习与优化，239页pdf

专知会员服务

39+阅读 · 2023年8月1日

分子表示如何用图学习？圣母大学等《图分子表示学习》最新简明综述，表述方法、数据集、应用等

分子表示如何用图学习？圣母大学等《图分子表示学习》最新简明综述，表述方法、数据集、应用等

专知会员服务

27+阅读 · 2022年7月12日

量子机器学习的基础和应用：一个简明文献综述

量子机器学习的基础和应用：一个简明文献综述

专知会员服务

39+阅读 · 2022年6月28日

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

专知会员服务

48+阅读 · 2021年12月22日

【干货书】机器学习的一阶和随机优化方法，591页pdf阐述机器学习算法基础概念和近期进展

【干货书】机器学习的一阶和随机优化方法，591页pdf阐述机器学习算法基础概念和近期进展

专知会员服务

82+阅读 · 2021年5月13日

机器学习组合优化

机器学习组合优化

专知会员服务

111+阅读 · 2021年2月16日

机器学习的可解释性

机器学习的可解释性

专知会员服务

69+阅读 · 2020年12月18日

【BAAI|2019】用深度学习模拟原子间势，王涵（附pdf）

【BAAI|2019】用深度学习模拟原子间势，王涵（附pdf）

专知会员服务

18+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

算法战加速推进：五角大楼项目、供应商生态体系与军事创新的战略重塑

《从技术突破到战场应用：发挥原型开发效能的最佳实践》报告

《美国首席数字与人工智能办公室（CDAO）人工智能治理与采办流程效能评估》报告

探秘Palantir：驱动美情报的科技巨头

相关资讯

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知

135+阅读 · 2020年2月15日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

博客 | 机器学习中的数学基础（凸优化）

博客 | 机器学习中的数学基础（凸优化）

AI研习社

14+阅读 · 2018年12月16日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

学界 | CVPR 2018论文解读：让神经网络学习比较来实现少样本学习

学界 | CVPR 2018论文解读：让神经网络学习比较来实现少样本学习

AI科技评论

14+阅读 · 2018年4月5日

从浅层模型到深度模型：概览机器学习优化算法

从浅层模型到深度模型：概览机器学习优化算法

机器之心

27+阅读 · 2017年7月9日

相关论文

A Theory of Feature Learning in Kernel Models

Arxiv

0+阅读 · 2月16日

From Evaluation to Design: Using Potential Energy Surface Smoothness Metrics to Guide Machine Learning Interatomic Potential Architectures

Arxiv

0+阅读 · 2月4日

Multimodal Scientific Learning Beyond Diffusions and Flows

Arxiv

0+阅读 · 2月1日

DistMLIP: A Distributed Inference Platform for Machine Learning Interatomic Potentials

Arxiv

0+阅读 · 1月31日

Over-Alignment vs Over-Fitting: The Role of Feature Learning Strength in Generalization

Arxiv

0+阅读 · 1月31日

Learning Dynamic Representations via An Optimally-Weighted Maximum Mean Discrepancy Optimization Framework for Continual Learning

Arxiv

0+阅读 · 1月27日

Pushing the limits of unconstrained machine-learned interatomic potentials

Arxiv

0+阅读 · 1月22日

Active Learning Strategies for Efficient Machine-Learned Interatomic Potentials Across Diverse Material Systems

Arxiv

0+阅读 · 1月21日

BLIPs: Bayesian Learned Interatomic Potentials

Arxiv

0+阅读 · 1月16日

Automated Machine Learning in Radiomics: A Comparative Evaluation of Performance, Efficiency and Accessibility

Arxiv

0+阅读 · 1月13日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于渐进结构化学习的高维信息稀疏表示理论与技术

国家自然科学基金

0+阅读 · 2015年12月31日

基于非线性流形学习的极化SAR特征提取与匹配技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员