Sample Efficient Generative Molecular Optimization with Joint Self-Improvement - 专知论文

会员服务 ·

0

分子 · 分子优化 · 样本 · 代理模型 · 分布偏移 ·

Sample Efficient Generative Molecular Optimization with Joint Self-Improvement

翻译：样本高效的联合自改进生成式分子优化

Serra Korkmaz,Adam Izdebski,Jonathan Pirnay,Rasmus Møller-Larsen,Michal Kmicikiewicz,Pankhil Gawade,Dominik G. Grimm,Ewa Szczurek

from arxiv, 14 pages, 5 figures

Generative molecular optimization aims to design molecules with properties surpassing those of existing compounds. However, such candidates are rare and expensive to evaluate, yielding sample efficiency essential. Additionally, surrogate models introduced to predict molecule evaluations, suffer from distribution shift as optimization drives candidates increasingly out-of-distribution. To address these challenges, we introduce Joint Self-Improvement, which benefits from (i) a joint generative-predictive model and (ii) a self-improving sampling scheme. The former aligns the generator with the surrogate, alleviating distribution shift, while the latter biases the generative part of the joint model using the predictive one to efficiently generate optimized molecules at inference-time. Experiments across offline and online molecular optimization benchmarks demonstrate that Joint Self-Improvement outperforms state-of-the-art methods under limited evaluation budgets.

翻译：生成式分子优化旨在设计出性质超越现有化合物的分子。然而，这类候选分子稀少且评估成本高昂，因此样本效率至关重要。此外，为预测分子评估而引入的代理模型，会因优化过程驱使候选分子日益偏离训练数据分布而遭受分布偏移问题。为应对这些挑战，我们提出了联合自改进方法，其优势在于：（i）一个联合的生成-预测模型，以及（ii）一种自改进的采样策略。前者通过使生成器与代理模型对齐来缓解分布偏移，而后者则在推理阶段利用预测模型对联合模型的生成部分进行偏置，从而高效地生成优化后的分子。在离线和在线分子优化基准测试上的实验表明，在有限的评估预算下，联合自改进方法优于现有最先进方法。

0

相关内容

基于文本引导的分子发现中大型语言模型综述：从分子生成到优化

基于文本引导的分子发现中大型语言模型综述：从分子生成到优化

专知会员服务

7+阅读 · 2025年5月24日

多样化偏好优化

多样化偏好优化

专知会员服务

12+阅读 · 2025年2月3日

【伯克利博士论文】网络优化算法及其在分子生物学中的应用，236页pdf

【伯克利博士论文】网络优化算法及其在分子生物学中的应用，236页pdf

专知会员服务

15+阅读 · 2022年12月21日

主动学习预测结合自由能进行分子优化

主动学习预测结合自由能进行分子优化

专知会员服务

16+阅读 · 2022年9月18日

深度学习在分子生成和分子性质预测中的应用

深度学习在分子生成和分子性质预测中的应用

专知会员服务

37+阅读 · 2022年6月19日

【ICLR2022】MIT最新论文《用于分子生成的数据高效图文法学习》，用图文法生成新分子，Data-Efficient Graph Grammar Learning for Molecular Generation

【ICLR2022】MIT最新论文《用于分子生成的数据高效图文法学习》，用图文法生成新分子，Data-Efficient Graph Grammar Learning for Molecular Generation

专知会员服务

14+阅读 · 2022年4月10日

【Nature. Mach. Intell. 】基于条件transformer、知识蒸馏和强化学习的多约束分子生成

【Nature. Mach. Intell. 】基于条件transformer、知识蒸馏和强化学习的多约束分子生成

专知会员服务

30+阅读 · 2022年3月27日

【ACL2022】解释生成的多尺度分布深度变分自编码器, Multi-Scale Distribution Deep Variational Autoencoder for Explanation Generation

【ACL2022】解释生成的多尺度分布深度变分自编码器, Multi-Scale Distribution Deep Variational Autoencoder for Explanation Generation

专知会员服务

12+阅读 · 2022年3月24日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知会员服务

46+阅读 · 2020年8月9日

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

专知会员服务

28+阅读 · 2020年2月20日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

药物化学第二期：蛋白质-小分子对接Score函数总结

药物化学第二期：蛋白质-小分子对接Score函数总结

GenomicAI

30+阅读 · 2022年3月5日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

自动特征工程在推荐系统中的研究

自动特征工程在推荐系统中的研究

DataFunTalk

10+阅读 · 2019年12月20日

《变分自编码器（VAE）导论》93页书册，附PDF下载

《变分自编码器（VAE）导论》93页书册，附PDF下载

专知

61+阅读 · 2019年6月14日

【ICML2019】中科院自动化所-针对小样本问题的学习生成匹配网络方法

【ICML2019】中科院自动化所-针对小样本问题的学习生成匹配网络方法

专知

59+阅读 · 2019年5月27日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

基于日内模式的因子改进丨优矿深度报告系列（九）

基于日内模式的因子改进丨优矿深度报告系列（九）

优矿量化实验室

10+阅读 · 2018年7月3日

【干货】一文读懂什么是变分自编码器

【干货】一文读懂什么是变分自编码器

专知

12+阅读 · 2018年2月11日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

手性磷酸和过渡金属共催化的串联反应研究：高对映选择性地合成杂环化合物

国家自然科学基金

1+阅读 · 2015年12月31日

核酸适配体功能化有序介孔炭材料的制备及其在生物样品分析中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于微型批量采样的分布式多智能个体网络协同优化算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于自适应采样和变复杂度近似的多学科稳健性设计优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

变步长和变正则化因子的子带自适应滤波算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

演化优化的自适应约束处理机理及在生化过程中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于DEM样本的交互式地形合成方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于组分分离的生物质高值化转化研究

国家自然科学基金

0+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

Adaptive and Stratified Subsampling for High-Dimensional Robust Estimation

Arxiv

0+阅读 · 3月10日

Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

Arxiv

0+阅读 · 3月7日

APAO: Adaptive Prefix-Aware Optimization for Generative Recommendation

Arxiv

0+阅读 · 3月3日

MolHIT: Advancing Molecular-Graph Generation with Hierarchical Discrete Diffusion Models

Arxiv

0+阅读 · 2月19日

Enhanced Diffusion Sampling: Efficient Rare Event Sampling and Free Energy Calculation with Diffusion Models

Arxiv

0+阅读 · 2月18日

SEISMO: Increasing Sample Efficiency in Molecular Optimization with a Trajectory-Aware LLM Agent

Arxiv

0+阅读 · 2月18日

Stabilizing Test-Time Adaptation of High-Dimensional Simulation Surrogates via D-Optimal Statistics

Arxiv

0+阅读 · 2月17日

Efficient Personalization of Generative Models via Optimal Experimental Design

Arxiv

0+阅读 · 2月16日

Amortized Molecular Optimization via Group Relative Policy Optimization

Arxiv

0+阅读 · 2月12日

Controlled Self-Evolution for Algorithmic Code Optimization

Arxiv

0+阅读 · 2月12日

VIP会员

文章信息

相关主题

最新内容

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

8+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

8+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

3+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

5+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

6+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

5+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

7+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

8+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

7+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

8+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

8+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

15+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

8+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

10+阅读 · 7月19日

相关VIP内容

基于文本引导的分子发现中大型语言模型综述：从分子生成到优化

基于文本引导的分子发现中大型语言模型综述：从分子生成到优化

专知会员服务

7+阅读 · 2025年5月24日

多样化偏好优化

多样化偏好优化

专知会员服务

12+阅读 · 2025年2月3日

【伯克利博士论文】网络优化算法及其在分子生物学中的应用，236页pdf

【伯克利博士论文】网络优化算法及其在分子生物学中的应用，236页pdf

专知会员服务

15+阅读 · 2022年12月21日

主动学习预测结合自由能进行分子优化

主动学习预测结合自由能进行分子优化

专知会员服务

16+阅读 · 2022年9月18日

深度学习在分子生成和分子性质预测中的应用

深度学习在分子生成和分子性质预测中的应用

专知会员服务

37+阅读 · 2022年6月19日

【ICLR2022】MIT最新论文《用于分子生成的数据高效图文法学习》，用图文法生成新分子，Data-Efficient Graph Grammar Learning for Molecular Generation

【ICLR2022】MIT最新论文《用于分子生成的数据高效图文法学习》，用图文法生成新分子，Data-Efficient Graph Grammar Learning for Molecular Generation

专知会员服务

14+阅读 · 2022年4月10日

【Nature. Mach. Intell. 】基于条件transformer、知识蒸馏和强化学习的多约束分子生成

【Nature. Mach. Intell. 】基于条件transformer、知识蒸馏和强化学习的多约束分子生成

专知会员服务

30+阅读 · 2022年3月27日

【ACL2022】解释生成的多尺度分布深度变分自编码器, Multi-Scale Distribution Deep Variational Autoencoder for Explanation Generation

【ACL2022】解释生成的多尺度分布深度变分自编码器, Multi-Scale Distribution Deep Variational Autoencoder for Explanation Generation

专知会员服务

12+阅读 · 2022年3月24日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知会员服务

46+阅读 · 2020年8月9日

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

【MIT】生成模型提出的分子的可合成性，48页pdf,The Synthesizability of Molecules Proposed by Generative Models

专知会员服务

28+阅读 · 2020年2月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

《无人机对海面作战影响评估》

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

药物化学第二期：蛋白质-小分子对接Score函数总结

药物化学第二期：蛋白质-小分子对接Score函数总结

GenomicAI

30+阅读 · 2022年3月5日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

自动特征工程在推荐系统中的研究

自动特征工程在推荐系统中的研究

DataFunTalk

10+阅读 · 2019年12月20日

《变分自编码器（VAE）导论》93页书册，附PDF下载

《变分自编码器（VAE）导论》93页书册，附PDF下载

专知

61+阅读 · 2019年6月14日

【ICML2019】中科院自动化所-针对小样本问题的学习生成匹配网络方法

【ICML2019】中科院自动化所-针对小样本问题的学习生成匹配网络方法

专知

59+阅读 · 2019年5月27日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

基于日内模式的因子改进丨优矿深度报告系列（九）

基于日内模式的因子改进丨优矿深度报告系列（九）

优矿量化实验室

10+阅读 · 2018年7月3日

【干货】一文读懂什么是变分自编码器

【干货】一文读懂什么是变分自编码器

专知

12+阅读 · 2018年2月11日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

相关论文

Adaptive and Stratified Subsampling for High-Dimensional Robust Estimation

Arxiv

0+阅读 · 3月10日

Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

Arxiv

0+阅读 · 3月7日

APAO: Adaptive Prefix-Aware Optimization for Generative Recommendation

Arxiv

0+阅读 · 3月3日

MolHIT: Advancing Molecular-Graph Generation with Hierarchical Discrete Diffusion Models

Arxiv

0+阅读 · 2月19日

Enhanced Diffusion Sampling: Efficient Rare Event Sampling and Free Energy Calculation with Diffusion Models

Arxiv

0+阅读 · 2月18日

SEISMO: Increasing Sample Efficiency in Molecular Optimization with a Trajectory-Aware LLM Agent

Arxiv

0+阅读 · 2月18日

Stabilizing Test-Time Adaptation of High-Dimensional Simulation Surrogates via D-Optimal Statistics

Arxiv

0+阅读 · 2月17日

Efficient Personalization of Generative Models via Optimal Experimental Design

Arxiv

0+阅读 · 2月16日

Amortized Molecular Optimization via Group Relative Policy Optimization

Arxiv

0+阅读 · 2月12日

Controlled Self-Evolution for Algorithmic Code Optimization

Arxiv

0+阅读 · 2月12日

相关基金

手性磷酸和过渡金属共催化的串联反应研究：高对映选择性地合成杂环化合物

国家自然科学基金

1+阅读 · 2015年12月31日

核酸适配体功能化有序介孔炭材料的制备及其在生物样品分析中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于微型批量采样的分布式多智能个体网络协同优化算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于自适应采样和变复杂度近似的多学科稳健性设计优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

变步长和变正则化因子的子带自适应滤波算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

演化优化的自适应约束处理机理及在生化过程中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于DEM样本的交互式地形合成方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于组分分离的生物质高值化转化研究

国家自然科学基金

0+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员