My Chemical Harness: Evolutionary Molecular Design over Synthetic Pathways with Large Language Model Agents - 专知论文

会员服务 ·

0

路径 · 分子 · 合成 · 设计 · 分子设计 ·

My Chemical Harness: Evolutionary Molecular Design over Synthetic Pathways with Large Language Model Agents

翻译：我的化学 harness：基于大型语言模型智能体的合成路径进化分子设计

César Ojeda,Darius A. Faroughy,Maryam Karimi,Payam Zarrintaj,Mir Mehdi Seyedebrahimi,Martín Carballo-Pacheco

from arxiv, 27 pages | 10 figures

Designing molecules with target properties is most useful when candidate structures are accompanied by feasible synthetic routes. We introduce My Chemical Harness, a route-native evolutionary framework for goal-directed molecular design in which the search population consists of executable synthetic pathways rather than isolated molecular graphs. Each route is built from purchasable building blocks and reaction templates, executed by deterministic chemistry tools, and scored through task-specific molecular oracles. Large language models (LLMs) are used only as strategy controllers that select high-level preferences over route length, move type, reaction families, motifs, and exploration pressure, while local code performs route construction, validation, deduplication, scoring, selection, and memory updates. This separation lets the LLM guide exploration without allowing it to introduce hallucinated products or unsupported reaction steps. On a soluble epoxide hydrolase proxy task, our LLM agent improves over single pass LLM and deterministic controllers, reaching state-of-the-art performance across the sEH score, synthetic accessibility score, and AiZynthFinder success rate metrics. These results suggest that constrained LLM agents can play a significant role in molecular discovery without requiring training, fine-tuning, or dedicated generative models.

翻译：当候选结构伴随可行合成路线时，以目标性质设计分子最为有用。我们提出"我的化学 harness"（My Chemical Harness），一种面向目标分子设计的路径原生进化框架，其搜索种群由可执行的合成路径而非孤立分子图构成。每条路径由可购买的构建模块和反应模板构建，通过确定性化学工具执行，并通过任务特异性分子预测器进行评分。大型语言模型（LLMs）仅作为策略控制器使用，用于选择关于路径长度、移动类型、反应家族、结构基序及探索压力的高层次偏好，而局部代码则执行路径构建、验证、去重、评分、选择及记忆更新。这种分离使LLM能够指导探索，同时避免其引入幻觉产物或不可支持的反应步骤。在可溶性环氧水解酶代理任务上，我们的LLM智能体优于单次LLM和确定性控制器，在sEH分数、合成可及性分数及AiZynthFinder成功率指标上均达到最优性能。这些结果表明，受约束的LLM智能体无需训练、微调或专用生成模型，即可在分子发现中发挥重要作用。

0

相关内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

8+阅读 · 5月30日

博士论文 | CMU 2024 | 用于特定目标药物设计的深度生成方法 170页

博士论文 | CMU 2024 | 用于特定目标药物设计的深度生成方法 170页

专知会员服务

13+阅读 · 2024年9月23日

【ETHZ博士论文】用生成式语言模型加速分子发现

【ETHZ博士论文】用生成式语言模型加速分子发现

专知会员服务

31+阅读 · 2023年6月4日

J. Med. Chem. | ChemistGA：一种多目标可合成全新药物设计方法

J. Med. Chem. | ChemistGA：一种多目标可合成全新药物设计方法

专知会员服务

11+阅读 · 2022年9月18日

综述：基于进化和物理启发建模的计算蛋白设计

综述：基于进化和物理启发建模的计算蛋白设计

专知会员服务

16+阅读 · 2022年9月12日

深度学习在分子生成和分子性质预测中的应用

深度学习在分子生成和分子性质预测中的应用

专知会员服务

36+阅读 · 2022年6月19日

【Nature. Mach. Intell. 】基于条件transformer、知识蒸馏和强化学习的多约束分子生成

【Nature. Mach. Intell. 】基于条件transformer、知识蒸馏和强化学习的多约束分子生成

专知会员服务

30+阅读 · 2022年3月27日

【ICML2020】通过神经引导的A*搜索学习逆合成设计

【ICML2020】通过神经引导的A*搜索学习逆合成设计

专知会员服务

19+阅读 · 2020年8月18日

【ICML2020】北大本科生提出基于图到图翻译的分子逆合成预测框架

【ICML2020】北大本科生提出基于图到图翻译的分子逆合成预测框架

专知会员服务

15+阅读 · 2020年7月15日

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

专知会员服务

28+阅读 · 2020年2月20日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

药物化学第二期：蛋白质-小分子对接Score函数总结

药物化学第二期：蛋白质-小分子对接Score函数总结

GenomicAI

30+阅读 · 2022年3月5日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

专知

48+阅读 · 2020年1月21日

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

专知

29+阅读 · 2019年9月25日

深度自进化聚类：Deep Self-Evolution Clustering

深度自进化聚类：Deep Self-Evolution Clustering

我爱读PAMI

15+阅读 · 2019年4月13日

Nature子刊：电催化合成氨领域获得突破！

Nature子刊：电催化合成氨领域获得突破！

材料科学与工程

10+阅读 · 2019年3月9日

读书报告 | Deep Learning for Extreme Multi-label Text Classification

读书报告 | Deep Learning for Extreme Multi-label Text Classification

科技创新与创业

48+阅读 · 2018年1月10日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

手性磷酸和过渡金属共催化的串联反应研究：高对映选择性地合成杂环化合物

国家自然科学基金

1+阅读 · 2015年12月31日

新型荧光DNA修饰碱基的分子设计及其分子识别能力的理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

新型核酸碱基分子设计及其功能性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于分子进化的蛋白质共进化高维互信息模型

国家自然科学基金

4+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

进化算法行为分析及应用

国家自然科学基金

1+阅读 · 2015年12月31日

用于酶促合成生物柴油的离子液体体系理性设计及构效关系

国家自然科学基金

0+阅读 · 2015年12月31日

作物分子设计育种理论及其在玉米株型改良中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于肽类分子的多组分共组装：理性设计、多级调控与生物应用

国家自然科学基金

2+阅读 · 2014年12月31日

Generative Molecular Design with Steerable and Granular Synthesizability Control

Arxiv

0+阅读 · 6月15日

MeEvo: Metacognitive Evolution Combined with Natural Evolution for Automatic Heuristic Design

Arxiv

0+阅读 · 6月15日

MolE-RAG: Molecular Structure-Enhanced Retrieval-Augmented Generation for Chemistry

Arxiv

0+阅读 · 6月14日

HarnessX: A Composable, Adaptive, and Evolvable Agent Harness Foundry

Arxiv

0+阅读 · 6月12日

MeEvo: Metacognitive Evolution Combined with Natural Evolution for Automatic Heuristic Design

Arxiv

0+阅读 · 6月12日

MolE-RAG: Molecular Structure-Enhanced Retrieval-Augmented Generation for Chemistry

Arxiv

0+阅读 · 6月4日

SurfDesign: Effective Protein Design on Molecular Surfaces

Arxiv

0+阅读 · 5月25日

Evolutionary Ensemble of Agents

Arxiv

0+阅读 · 5月14日

The Geno-Synthetic Algorithm: Type-Factored Coevolutionary Optimization for Heterogeneous Genotypes and Assembled Phenotypes

Arxiv

0+阅读 · 5月13日

LLM-Augmented Chemical Synthesis and Design Decision Programs

Arxiv

0+阅读 · 5月10日

VIP会员

文章信息

相关主题

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

4+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

2+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

2+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

3+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

4+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

3+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

8+阅读 · 5月30日

博士论文 | CMU 2024 | 用于特定目标药物设计的深度生成方法 170页

博士论文 | CMU 2024 | 用于特定目标药物设计的深度生成方法 170页

专知会员服务

13+阅读 · 2024年9月23日

【ETHZ博士论文】用生成式语言模型加速分子发现

【ETHZ博士论文】用生成式语言模型加速分子发现

专知会员服务

31+阅读 · 2023年6月4日

J. Med. Chem. | ChemistGA：一种多目标可合成全新药物设计方法

J. Med. Chem. | ChemistGA：一种多目标可合成全新药物设计方法

专知会员服务

11+阅读 · 2022年9月18日

综述：基于进化和物理启发建模的计算蛋白设计

综述：基于进化和物理启发建模的计算蛋白设计

专知会员服务

16+阅读 · 2022年9月12日

深度学习在分子生成和分子性质预测中的应用

深度学习在分子生成和分子性质预测中的应用

专知会员服务

36+阅读 · 2022年6月19日

【Nature. Mach. Intell. 】基于条件transformer、知识蒸馏和强化学习的多约束分子生成

【Nature. Mach. Intell. 】基于条件transformer、知识蒸馏和强化学习的多约束分子生成

专知会员服务

30+阅读 · 2022年3月27日

【ICML2020】通过神经引导的A*搜索学习逆合成设计

【ICML2020】通过神经引导的A*搜索学习逆合成设计

专知会员服务

19+阅读 · 2020年8月18日

【ICML2020】北大本科生提出基于图到图翻译的分子逆合成预测框架

【ICML2020】北大本科生提出基于图到图翻译的分子逆合成预测框架

专知会员服务

15+阅读 · 2020年7月15日

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

专知会员服务

28+阅读 · 2020年2月20日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

药物化学第二期：蛋白质-小分子对接Score函数总结

药物化学第二期：蛋白质-小分子对接Score函数总结

GenomicAI

30+阅读 · 2022年3月5日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

康奈尔大学Jon Kleinberg经典书《算法设计Algorithm Design》课件PPT与电子书，864页pdf

专知

48+阅读 · 2020年1月21日

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

专知

29+阅读 · 2019年9月25日

深度自进化聚类：Deep Self-Evolution Clustering

深度自进化聚类：Deep Self-Evolution Clustering

我爱读PAMI

15+阅读 · 2019年4月13日

Nature子刊：电催化合成氨领域获得突破！

Nature子刊：电催化合成氨领域获得突破！

材料科学与工程

10+阅读 · 2019年3月9日

读书报告 | Deep Learning for Extreme Multi-label Text Classification

读书报告 | Deep Learning for Extreme Multi-label Text Classification

科技创新与创业

48+阅读 · 2018年1月10日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Generative Molecular Design with Steerable and Granular Synthesizability Control

Arxiv

0+阅读 · 6月15日

MeEvo: Metacognitive Evolution Combined with Natural Evolution for Automatic Heuristic Design

Arxiv

0+阅读 · 6月15日

MolE-RAG: Molecular Structure-Enhanced Retrieval-Augmented Generation for Chemistry

Arxiv

0+阅读 · 6月14日

HarnessX: A Composable, Adaptive, and Evolvable Agent Harness Foundry

Arxiv

0+阅读 · 6月12日

MeEvo: Metacognitive Evolution Combined with Natural Evolution for Automatic Heuristic Design

Arxiv

0+阅读 · 6月12日

MolE-RAG: Molecular Structure-Enhanced Retrieval-Augmented Generation for Chemistry

Arxiv

0+阅读 · 6月4日

SurfDesign: Effective Protein Design on Molecular Surfaces

Arxiv

0+阅读 · 5月25日

Evolutionary Ensemble of Agents

Arxiv

0+阅读 · 5月14日

The Geno-Synthetic Algorithm: Type-Factored Coevolutionary Optimization for Heterogeneous Genotypes and Assembled Phenotypes

Arxiv

0+阅读 · 5月13日

LLM-Augmented Chemical Synthesis and Design Decision Programs

Arxiv

0+阅读 · 5月10日

相关基金

手性磷酸和过渡金属共催化的串联反应研究：高对映选择性地合成杂环化合物

国家自然科学基金

1+阅读 · 2015年12月31日

新型荧光DNA修饰碱基的分子设计及其分子识别能力的理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

新型核酸碱基分子设计及其功能性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于分子进化的蛋白质共进化高维互信息模型

国家自然科学基金

4+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

进化算法行为分析及应用

国家自然科学基金

1+阅读 · 2015年12月31日

用于酶促合成生物柴油的离子液体体系理性设计及构效关系

国家自然科学基金

0+阅读 · 2015年12月31日

作物分子设计育种理论及其在玉米株型改良中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于肽类分子的多组分共组装：理性设计、多级调控与生物应用

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员