LLM-Augmented Chemical Synthesis and Design Decision Programs - 专知论文

会员服务 ·

0

合成 · 逆合成 · 设计 · 路径 · 设计决策 ·

LLM-Augmented Chemical Synthesis and Design Decision Programs

翻译：LLM增强的化学合成与设计决策程序

Haorui Wang,Jeff Guo,Lingkai Kong,Rampi Ramprasad,Philippe Schwaller,Yuanqi Du,Chao Zhang

from arxiv, ICML 2025

Retrosynthesis, the process of breaking down a target molecule into simpler precursors through a series of valid reactions, stands at the core of organic chemistry and drug development. Although recent machine learning (ML) research has advanced single-step retrosynthetic modeling and subsequent route searches, these solutions remain restricted by the extensive combinatorial space of possible pathways. Concurrently, large language models (LLMs) have exhibited remarkable chemical knowledge, hinting at their potential to tackle complex decision-making tasks in chemistry. In this work, we explore whether LLMs can successfully navigate the highly constrained, multi-step retrosynthesis planning problem. We introduce an efficient scheme for encoding reaction pathways and present a new route-level search strategy, moving beyond the conventional step-by-step reactant prediction. Through comprehensive evaluations, we show that our LLM-augmented approach excels at retrosynthesis planning and extends naturally to the broader challenge of synthesizable molecular design.

翻译：逆合成分析，即通过一系列有效反应将目标分子逐步分解为更简单前体的过程，是有机化学和药物开发的核心。尽管近期机器学习（ML）研究推动了单步逆合成建模及后续路径搜索的进步，但这些方案仍受限于可能路径的庞大组合空间。与此同时，大型语言模型（LLMs）已展现出卓越的化学知识，暗示其在应对化学领域复杂决策任务中的潜力。在本工作中，我们探究了LLMs能否成功解决高度约束的多步逆合成规划问题。我们提出了一种高效的反应路径编码方案，并引入了一种超越传统逐步骤反应物预测的全新路线级搜索策略。通过全面评估，我们证明所提出的LLM增强方法在逆合成规划中表现优异，并能自然延伸至可合成分子设计这一更广泛的挑战。

0

相关内容

【ACL2025教程】LLM时代的合成数据，228页slides

【ACL2025教程】LLM时代的合成数据，228页slides

专知会员服务

31+阅读 · 2025年7月30日

【NTU博士论文】基于协作式多智能体强化学习的决策制定

【NTU博士论文】基于协作式多智能体强化学习的决策制定

专知会员服务

40+阅读 · 2025年4月21日

从基础到突破的LLM微调终极指南：技术、研究、最佳实践、应用研究挑战与机遇的全面综述

从基础到突破的LLM微调终极指南：技术、研究、最佳实践、应用研究挑战与机遇的全面综述

专知会员服务

56+阅读 · 2024年11月17日

基于大语言模型（LLM）的合成数据生成、策展和评估的综述

基于大语言模型（LLM）的合成数据生成、策展和评估的综述

专知会员服务

62+阅读 · 2024年7月5日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

什么是合成生物学？最新《合成生物学深度报告》深度报告，51页ppt

什么是合成生物学？最新《合成生物学深度报告》深度报告，51页ppt

专知会员服务

41+阅读 · 2023年2月7日

综述分享 | 计算机辅助化合物逆合成预测

综述分享 | 计算机辅助化合物逆合成预测

专知会员服务

11+阅读 · 2022年5月6日

【AI+制药】MIT（ICLR 2022）：开发新药的更智能方法——面向自下而上合成规划和可合成分子设计的摊销树生成

【AI+制药】MIT（ICLR 2022）：开发新药的更智能方法——面向自下而上合成规划和可合成分子设计的摊销树生成

专知会员服务

16+阅读 · 2022年5月6日

【ICML2020】通过神经引导的A*搜索学习逆合成设计

【ICML2020】通过神经引导的A*搜索学习逆合成设计

专知会员服务

19+阅读 · 2020年8月18日

【ICML2020】北大本科生提出基于图到图翻译的分子逆合成预测框架

【ICML2020】北大本科生提出基于图到图翻译的分子逆合成预测框架

专知会员服务

15+阅读 · 2020年7月15日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

图怎么用强化学习？东北大学最新《图强化学习》综述论文，54页pdf阐述GRL方法、数据与应用

图怎么用强化学习？东北大学最新《图强化学习》综述论文，54页pdf阐述GRL方法、数据与应用

专知

12+阅读 · 2022年4月14日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

专知

12+阅读 · 2019年12月16日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

一文了解强化学习

一文了解强化学习

AI100

15+阅读 · 2018年8月20日

手性磷酸和过渡金属共催化的串联反应研究：高对映选择性地合成杂环化合物

国家自然科学基金

1+阅读 · 2015年12月31日

微反应器内紫罗兰酮连续合成工程与工艺研究

国家自然科学基金

0+阅读 · 2015年12月31日

合成气与二甲醚一步制取乙醇催化剂的设计、可控合成及反应机理

国家自然科学基金

0+阅读 · 2014年12月31日

硅-氢区域选择加成反应超微孔催化剂构建及反应机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

Cu基催化剂作用下甲烷-合成气定向合成乙醇的构效关系

国家自然科学基金

0+阅读 · 2014年12月31日

复杂体系和化学过程的化学计量学解析与应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

离子液体催化合成聚碳酸酯反应过程及产品结构调控机制

国家自然科学基金

0+阅读 · 2014年12月31日

碳修饰的铋系纳米复合光催化剂的设计、制备与应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于细菌脂肪酸合成途径中多靶标的新型抗菌剂设计开发

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构化方法的复杂研发项目多领域集成分析与优化研究

国家自然科学基金

2+阅读 · 2014年12月31日

Generative Molecular Design with Steerable and Granular Synthesizability Control

Arxiv

0+阅读 · 6月15日

MolE-RAG: Molecular Structure-Enhanced Retrieval-Augmented Generation for Chemistry

Arxiv

0+阅读 · 6月14日

Retro-Expert: Collaborative Reasoning for Interpretable Retrosynthesis

Arxiv

0+阅读 · 6月13日

On Cost-Effective LLM-as-a-Judge Improvement Techniques

Arxiv

0+阅读 · 6月9日

LLM Agent-Assisted Reverse Engineering with Quantitative Readability Metrics

Arxiv

0+阅读 · 6月5日

MolE-RAG: Molecular Structure-Enhanced Retrieval-Augmented Generation for Chemistry

Arxiv

0+阅读 · 6月4日

StepPRM-RTL: Stepwise Process-Reward Guided LLM Fine-Tuning for Enhanced RTL Synthesis

Arxiv

0+阅读 · 6月2日

Algorithmic algorithm development with LLMs: A Case Study on LLM-Usage for Contraction Order Optimization in Tensor Networks

Arxiv

0+阅读 · 6月1日

When Single Answer Is Not Enough: Rethinking Single-Step Retrosynthesis Benchmarks for LLMs

Arxiv

0+阅读 · 5月29日

Enhancing the Code Reasoning Capabilities of LLMs via Consistency-based Reinforcement Learning

Arxiv

0+阅读 · 5月18日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

9+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

【ACL2025教程】LLM时代的合成数据，228页slides

【ACL2025教程】LLM时代的合成数据，228页slides

专知会员服务

31+阅读 · 2025年7月30日

【NTU博士论文】基于协作式多智能体强化学习的决策制定

【NTU博士论文】基于协作式多智能体强化学习的决策制定

专知会员服务

40+阅读 · 2025年4月21日

从基础到突破的LLM微调终极指南：技术、研究、最佳实践、应用研究挑战与机遇的全面综述

从基础到突破的LLM微调终极指南：技术、研究、最佳实践、应用研究挑战与机遇的全面综述

专知会员服务

56+阅读 · 2024年11月17日

基于大语言模型（LLM）的合成数据生成、策展和评估的综述

基于大语言模型（LLM）的合成数据生成、策展和评估的综述

专知会员服务

62+阅读 · 2024年7月5日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

什么是合成生物学？最新《合成生物学深度报告》深度报告，51页ppt

什么是合成生物学？最新《合成生物学深度报告》深度报告，51页ppt

专知会员服务

41+阅读 · 2023年2月7日

综述分享 | 计算机辅助化合物逆合成预测

综述分享 | 计算机辅助化合物逆合成预测

专知会员服务

11+阅读 · 2022年5月6日

【AI+制药】MIT（ICLR 2022）：开发新药的更智能方法——面向自下而上合成规划和可合成分子设计的摊销树生成

【AI+制药】MIT（ICLR 2022）：开发新药的更智能方法——面向自下而上合成规划和可合成分子设计的摊销树生成

专知会员服务

16+阅读 · 2022年5月6日

【ICML2020】通过神经引导的A*搜索学习逆合成设计

【ICML2020】通过神经引导的A*搜索学习逆合成设计

专知会员服务

19+阅读 · 2020年8月18日

【ICML2020】北大本科生提出基于图到图翻译的分子逆合成预测框架

【ICML2020】北大本科生提出基于图到图翻译的分子逆合成预测框架

专知会员服务

15+阅读 · 2020年7月15日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

图怎么用强化学习？东北大学最新《图强化学习》综述论文，54页pdf阐述GRL方法、数据与应用

图怎么用强化学习？东北大学最新《图强化学习》综述论文，54页pdf阐述GRL方法、数据与应用

专知

12+阅读 · 2022年4月14日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

专知

12+阅读 · 2019年12月16日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

一文了解强化学习

一文了解强化学习

AI100

15+阅读 · 2018年8月20日

相关论文

Generative Molecular Design with Steerable and Granular Synthesizability Control

Arxiv

0+阅读 · 6月15日

MolE-RAG: Molecular Structure-Enhanced Retrieval-Augmented Generation for Chemistry

Arxiv

0+阅读 · 6月14日

Retro-Expert: Collaborative Reasoning for Interpretable Retrosynthesis

Arxiv

0+阅读 · 6月13日

On Cost-Effective LLM-as-a-Judge Improvement Techniques

Arxiv

0+阅读 · 6月9日

LLM Agent-Assisted Reverse Engineering with Quantitative Readability Metrics

Arxiv

0+阅读 · 6月5日

MolE-RAG: Molecular Structure-Enhanced Retrieval-Augmented Generation for Chemistry

Arxiv

0+阅读 · 6月4日

StepPRM-RTL: Stepwise Process-Reward Guided LLM Fine-Tuning for Enhanced RTL Synthesis

Arxiv

0+阅读 · 6月2日

Algorithmic algorithm development with LLMs: A Case Study on LLM-Usage for Contraction Order Optimization in Tensor Networks

Arxiv

0+阅读 · 6月1日

When Single Answer Is Not Enough: Rethinking Single-Step Retrosynthesis Benchmarks for LLMs

Arxiv

0+阅读 · 5月29日

Enhancing the Code Reasoning Capabilities of LLMs via Consistency-based Reinforcement Learning

Arxiv

0+阅读 · 5月18日

相关基金

手性磷酸和过渡金属共催化的串联反应研究：高对映选择性地合成杂环化合物

国家自然科学基金

1+阅读 · 2015年12月31日

微反应器内紫罗兰酮连续合成工程与工艺研究

国家自然科学基金

0+阅读 · 2015年12月31日

合成气与二甲醚一步制取乙醇催化剂的设计、可控合成及反应机理

国家自然科学基金

0+阅读 · 2014年12月31日

硅-氢区域选择加成反应超微孔催化剂构建及反应机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

Cu基催化剂作用下甲烷-合成气定向合成乙醇的构效关系

国家自然科学基金

0+阅读 · 2014年12月31日

复杂体系和化学过程的化学计量学解析与应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

离子液体催化合成聚碳酸酯反应过程及产品结构调控机制

国家自然科学基金

0+阅读 · 2014年12月31日

碳修饰的铋系纳米复合光催化剂的设计、制备与应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于细菌脂肪酸合成途径中多靶标的新型抗菌剂设计开发

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构化方法的复杂研发项目多领域集成分析与优化研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员