Molecular structure elucidation from spectroscopic data is a long-standing challenge in Chemistry, traditionally requiring expert interpretation. We introduce NMIRacle, a two-stage generative framework that builds upon recent paradigms in AI-driven spectroscopy with minimal assumptions. In the first stage, NMIRacle learns to reconstruct molecular structures from count-aware fragment representations, capturing both fragment identities and their occurrences. In the second stage, a spectral encoder maps input spectra (IR, 1H-NMR, 13C-NMR) into a latent embedding used to condition the pre-trained generator, which is fine-tuned for direct spectra-to-molecule generation. This formulation bridges fragment-level chemical modeling with spectral evidence, yielding accurate molecular predictions. Empirical results demonstrate that NMIRacle outperforms existing baselines on molecular elucidation, while maintaining robust performance across increasing levels of molecular complexity.


翻译:从光谱数据解析分子结构是化学领域长期存在的挑战,传统上需要专家进行人工解读。本文提出NMIRacle——一个两阶段生成框架,该框架基于近期人工智能驱动光谱分析的研究范式,且仅需极少假设。第一阶段,NMIRacle学习从具有计数感知的片段表示中重建分子结构,同时捕捉片段身份及其出现频次。第二阶段,光谱编码器将输入光谱(红外光谱、氢-1核磁共振谱、碳-13核磁共振谱)映射为潜在嵌入向量,用于调控预训练的生成器;该生成器经过微调后可直接实现从光谱到分子的生成。此架构将片段级化学建模与光谱证据相融合,从而产生精确的分子预测。实验结果表明,NMIRacle在分子解析任务上优于现有基线方法,并在递增的分子复杂度水平上保持稳健性能。

0
下载
关闭预览

相关内容

【AI4Science】面向分子科学的数据智能,13页pdf
专知会员服务
29+阅读 · 2023年6月19日
【ICML2021】学习分子构象生成的梯度场
专知会员服务
15+阅读 · 2021年5月30日
技术动态 | 多模态知识图谱
开放知识图谱
38+阅读 · 2020年8月5日
从模型到应用,一文读懂因子分解机
AI100
10+阅读 · 2019年9月6日
详解GAN的谱归一化(Spectral Normalization)
PaperWeekly
11+阅读 · 2019年2月13日
NLG ≠ 机器写作 | 专家专栏
量子位
13+阅读 · 2018年9月10日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(简介)
专知会员服务
2+阅读 · 4月12日
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
5+阅读 · 4月12日
远程空中优势:新一代超视距导弹的兴起
专知会员服务
1+阅读 · 4月12日
大语言模型溯因推理的统一分类学与综述
专知会员服务
0+阅读 · 4月12日
相关VIP内容
【AI4Science】面向分子科学的数据智能,13页pdf
专知会员服务
29+阅读 · 2023年6月19日
【ICML2021】学习分子构象生成的梯度场
专知会员服务
15+阅读 · 2021年5月30日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员