Molecular structure elucidation from spectroscopic data is a long-standing challenge in Chemistry, traditionally requiring expert interpretation. We introduce NMIRacle, a two-stage generative framework that builds upon recent paradigms in AI-driven spectroscopy with minimal assumptions. In the first stage, NMIRacle learns to reconstruct molecular structures from count-aware fragment representations, capturing both fragment identities and their occurrences. In the second stage, a spectral encoder maps input spectra (IR, 1H-NMR, 13C-NMR) into a latent embedding used to condition the pre-trained generator, which is fine-tuned for direct spectra-to-molecule generation. This formulation bridges fragment-level chemical modeling with spectral evidence, yielding accurate molecular predictions. Empirical results demonstrate that NMIRacle outperforms existing baselines on molecular elucidation, while maintaining robust performance across increasing levels of molecular complexity.


翻译:从光谱数据解析分子结构是化学领域长期存在的挑战,传统上需要专家进行人工解读。本文提出NMIRacle——一个两阶段生成框架,该框架基于近期人工智能驱动光谱分析的研究范式,且仅需极少假设。第一阶段,NMIRacle学习从具有计数感知的片段表示中重建分子结构,同时捕捉片段身份及其出现频次。第二阶段,光谱编码器将输入光谱(红外光谱、氢-1核磁共振谱、碳-13核磁共振谱)映射为潜在嵌入向量,用于调控预训练的生成器;该生成器经过微调后可直接实现从光谱到分子的生成。此架构将片段级化学建模与光谱证据相融合,从而产生精确的分子预测。实验结果表明,NMIRacle在分子解析任务上优于现有基线方法,并在递增的分子复杂度水平上保持稳健性能。

0
下载
关闭预览

相关内容

【AI4Science】面向分子科学的数据智能,13页pdf
专知会员服务
29+阅读 · 2023年6月19日
【ICML2021】学习分子构象生成的梯度场
专知会员服务
15+阅读 · 2021年5月30日
技术动态 | 多模态知识图谱
开放知识图谱
38+阅读 · 2020年8月5日
从模型到应用,一文读懂因子分解机
AI100
10+阅读 · 2019年9月6日
详解GAN的谱归一化(Spectral Normalization)
PaperWeekly
11+阅读 · 2019年2月13日
NLG ≠ 机器写作 | 专家专栏
量子位
13+阅读 · 2018年9月10日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
1+阅读 · 今天15:35
KDD 2026 | MixRAGRec:面向LLM推荐的混合专家KG-RAG框架
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
4+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
14+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
8+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
相关VIP内容
【AI4Science】面向分子科学的数据智能,13页pdf
专知会员服务
29+阅读 · 2023年6月19日
【ICML2021】学习分子构象生成的梯度场
专知会员服务
15+阅读 · 2021年5月30日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员