Machine-learned interatomic potentials (MLIPs) are deployed for high-throughput materials screening without formal reliability guarantees. We show that a single MLIP used as a stability filter misses 93% of density functional theory (DFT)-stable materials (recall 0.07) on a 25,000-material benchmark. Proof-Carrying Materials (PCM) closes this gap through three stages: adversarial falsification across compositional space, bootstrap envelope refinement with 95% confidence intervals, and Lean 4 formal certification. Auditing CHGNet, TensorNet and MACE reveals architecture-specific blind spots with near-zero pairwise error correlations (r <= 0.13; n = 5,000), confirmed by independent Quantum ESPRESSO validation (20/20 converged; median DFT/CHGNet force ratio 12x). A risk model trained on PCM-discovered features predicts failures on unseen materials (AUC-ROC = 0.938 +/- 0.004) and transfers across architectures (cross-MLIP AUC-ROC ~ 0.70; feature importance r = 0.877). In a thermoelectric screening case study, PCM-audited protocols discover 62 additional stable materials missed by single-MLIP screening - a 25% improvement in discovery yield.


翻译:机器学习原子间势能(MLIPs)目前在高通量材料筛选中被广泛应用,但缺乏形式化的可靠性保证。我们通过25,000种材料的基准测试表明,单一MLIP作为稳定性过滤器会漏掉93%的密度泛函理论(DFT)稳定材料(召回率0.07)。可证伪材料(PCM)方法通过三个阶段填补这一空白:在成分空间中进行对抗性证伪、采用95%置信区间的自举包络细化,以及基于Lean 4的形式化验证。对CHGNet、TensorNet和MACE的审计揭示了架构特异性盲点,其成对误差相关性近乎为零(r ≤ 0.13;n = 5,000),该结果经独立Quantum ESPRESSO验证确认(20/20收敛;DFT/CHGNet力比中位数达12倍)。基于PCM发现特征训练的风险模型能有效预测未知材料的失效情况(AUC-ROC = 0.938 ± 0.004),并具备跨架构迁移能力(跨MLIP的AUC-ROC约0.70;特征重要性r = 0.877)。在热电材料筛选案例研究中,经PCM审计的筛选方案额外发现了62种被单一MLIP筛选遗漏的稳定材料——发现效率提升达25%。

0
下载
关闭预览

相关内容

工程可信赖的机器学习运维——基于零知识证明
专知会员服务
9+阅读 · 2025年5月27日
【剑桥大学博士论文】机器学习安全性,148页pdf
专知会员服务
43+阅读 · 2023年2月13日
【伯克利博士论文】机器学习安全性,172页pdf
专知会员服务
38+阅读 · 2022年12月6日
专知会员服务
43+阅读 · 2021年9月7日
机器学习的可解释性:因果推理和稳定学习
DataFunTalk
13+阅读 · 2020年3月3日
ICML2019机器学习顶会接受论文列表!
专知
10+阅读 · 2019年5月12日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
1+阅读 · 今天15:35
KDD 2026 | MixRAGRec:面向LLM推荐的混合专家KG-RAG框架
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
4+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
14+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
8+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
相关VIP内容
工程可信赖的机器学习运维——基于零知识证明
专知会员服务
9+阅读 · 2025年5月27日
【剑桥大学博士论文】机器学习安全性,148页pdf
专知会员服务
43+阅读 · 2023年2月13日
【伯克利博士论文】机器学习安全性,172页pdf
专知会员服务
38+阅读 · 2022年12月6日
专知会员服务
43+阅读 · 2021年9月7日
相关基金
Top
微信扫码咨询专知VIP会员