Designing novel inorganic materials through generative models remains an important challenge for material science, driven by the complexity and diversity of inorganic structures across expansive chemical compositions and structural landscape. The vast combinatorial space of inorganic compounds demands innovative, AI-driven approaches to overcome limitations in generative accuracy and efficiency. To address this, we introduce a novel method that redefines the encoding and generation of inorganic materials by utilizing domain-specific symmetry-aware representation. Our approach not only refines the representation of intricate inorganic structures but also contributes to the field of material discovery by enhancing the precision and stability of generated candidates. Central to our methodology is a novel padding technique that exploits crystal symmetry information to enhance the encoding process. By integrating Wyckoff position length-aware padding into an encoder architecture, we achieve a more robust informed representation of inorganic materials. This symmetry-driven enhancement improves deep learning models to generate stable, previously unexplored inorganic structures with superior accuracy and computational efficiency. Furthermore, we introduce an end-to-end system that leverages the machine learning potential models to seamlessly generate novel, even those unseen in the training data, and stable inorganic materials from initial data to validated output. This pipeline integrates advanced generative models with stability analysis, marking a significant leap forward in the automated exploration and design of next-generation inorganic materials. Our method improved reconstruction accuracy 5.3% in proton conductor data, and generated 63.5% more novel stable inorganic material to baseline model on the perov-5 dataset.


翻译:通过生成模型设计新型无机材料仍是材料科学中的重要挑战,其根源在于无机结构在广阔化学组成和结构空间中呈现出的复杂性与多样性。无机化合物庞大的组合空间要求采用创新性的AI驱动方法,以突破生成精度与效率的瓶颈。为此,我们提出了一种新型方法,通过利用领域特定的对称感知表征,重新定义了无机材料的编码与生成过程。该方法不仅优化了复杂无机结构的表征方式,还通过提升生成候选材料的精度与稳定性,为材料发现领域做出贡献。该方法的核心是一种创新的填充技术,该技术利用晶体对称性信息增强编码过程。通过将Wyckoff位置长度感知填充法集成至编码器架构中,我们实现了对无机材料更具鲁棒性的信息表征。这种对称性驱动的增强机制提升了深度学习模型生成稳定且前所未有的无机结构的能力,在保证高精度的同时兼具计算效率。此外,我们引入了一个端到端系统,该系统利用机器学习势模型,能够从初始数据到验证输出无缝生成新型(甚至包含训练数据中未见过的)稳定无机材料。该流程将先进生成模型与稳定性分析相结合,标志着下一代无机材料自动化探索与设计的重大飞跃。我们的方法在质子导体数据上将重构精度提升了5.3%,并在perov-5数据集上相比基线模型多生成了63.5%的新型稳定无机材料。

0
下载
关闭预览

相关内容

ACM/IEEE第23届模型驱动工程语言和系统国际会议,是模型驱动软件和系统工程的首要会议系列,由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来,模型涵盖了建模的各个方面,从语言和方法到工具和应用程序。模特的参加者来自不同的背景,包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛,参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会,并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。 官网链接:http://www.modelsconference.org/
【ICLR2024】3D-MoLM:增强语言模型对分子3D空间结构的理解
结合进化算法的深度强化学习方法研究综述
专知会员服务
81+阅读 · 2022年7月16日
【NeurIPS 2021】基于潜在空间能量模型的可控和组分生成
专知会员服务
17+阅读 · 2021年10月23日
【论文】结构GANs,Structured GANs,
专知会员服务
15+阅读 · 2020年1月16日
常用的模型集成方法介绍:bagging、boosting 、stacking
深度强化学习简介
专知
30+阅读 · 2018年12月3日
干货|浅谈强化学习的方法及学习路线
机器学习算法与Python学习
16+阅读 · 2018年3月28日
技术 | 强化学习入门以及代码实现
AI100
51+阅读 · 2017年8月26日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
4+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
Top
微信扫码咨询专知VIP会员