Decomposed Direct Preference Optimization for Structure-Based Drug Design - 专知论文

会员服务 ·

0

分子 · 结构 · 分解 · 设计 · 偏好优化 ·

Decomposed Direct Preference Optimization for Structure-Based Drug Design

翻译：基于结构药物设计的分解式直接偏好优化

Xiwei Cheng,Xiangxin Zhou,Yuwei Yang,Yu Bao,Quanquan Gu

from arxiv, Accepted by TMLR

Diffusion models have achieved promising results for Structure-Based Drug Design (SBDD). Nevertheless, high-quality protein subpocket and ligand data are relatively scarce, which hinders the models' generation capabilities. Recently, Direct Preference Optimization (DPO) has emerged as a pivotal tool for aligning generative models with human preferences. In this paper, we propose DecompDPO, a structure-based optimization method aligns diffusion models with pharmaceutical needs using multi-granularity preference pairs. DecompDPO introduces decomposition into the optimization objectives and obtains preference pairs at the molecule or decomposed substructure level based on each objective's decomposability. Additionally, DecompDPO introduces a physics-informed energy term to ensure reasonable molecular conformations in the optimization results. Notably, DecompDPO can be effectively used for two main purposes: (1) fine-tuning pretrained diffusion models for molecule generation across various protein families, and (2) molecular optimization given a specific protein subpocket after generation. Extensive experiments on the CrossDocked2020 benchmark show that DecompDPO significantly improves model performance, achieving up to 95.2% Med. High Affinity and a 36.2% success rate for molecule generation, and 100% Med. High Affinity and a 52.1% success rate for molecular optimization. Code is available at https://github.com/laviaf/DecompDPO.

翻译：扩散模型在基于结构的药物设计领域已取得显著成果。然而，高质量蛋白质亚口袋与配体数据相对稀缺，制约了模型的生成能力。近期，直接偏好优化已成为使生成模型与人类偏好对齐的关键工具。本文提出DecompDPO——一种基于结构的优化方法，通过多粒度偏好配对使扩散模型与药物研发需求对齐。该方法将分解机制引入优化目标，根据各目标的可分解性在分子或分解子结构层面构建偏好对。此外，DecompDPO引入物理信息能量项以确保优化结果中分子构象的合理性。值得注意的是，该方法可有效应用于两大场景：(1)针对不同蛋白质家族进行分子生成的预训练扩散模型微调；(2)在特定蛋白质亚口袋条件下对生成分子进行优化。在CrossDocked2020基准测试上的大量实验表明，DecompDPO显著提升了模型性能：在分子生成任务中达到95.2%的中高亲和力与36.2%的成功率，在分子优化任务中实现100%的中高亲和力与52.1%的成功率。代码已开源：https://github.com/laviaf/DecompDPO。

0

相关内容

《直接偏好优化研究综述》

《直接偏好优化研究综述》

专知会员服务

31+阅读 · 2025年3月18日

多样化偏好优化

多样化偏好优化

专知会员服务

12+阅读 · 2025年2月3日

直接偏好优化中的数据集、理论、变体和应用的综合综述

直接偏好优化中的数据集、理论、变体和应用的综合综述

专知会员服务

15+阅读 · 2024年10月24日

博士论文 | CMU 2024 | 用于特定目标药物设计的深度生成方法 170页

博士论文 | CMU 2024 | 用于特定目标药物设计的深度生成方法 170页

专知会员服务

13+阅读 · 2024年9月23日

【MIT博士论文】在结构约束下的机器学习优化方法, 257页pdf

【MIT博士论文】在结构约束下的机器学习优化方法, 257页pdf

专知会员服务

39+阅读 · 2023年8月6日

AI如何做药物设计？中科大最新《几何深度学习在基于结构的药物设计中》系统综述

AI如何做药物设计？中科大最新《几何深度学习在基于结构的药物设计中》系统综述

专知会员服务

24+阅读 · 2023年6月24日

基于深度学习和传统打分函数的配体构象优化框架

基于深度学习和传统打分函数的配体构象优化框架

专知会员服务

14+阅读 · 2023年1月9日

DiffSBDD：利用等变扩散模型进行基于结构的药物设计

DiffSBDD：利用等变扩散模型进行基于结构的药物设计

专知会员服务

14+阅读 · 2022年11月7日

基于结构的药物设计与几何深度学习

基于结构的药物设计与几何深度学习

专知会员服务

17+阅读 · 2022年10月31日

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

专知会员服务

11+阅读 · 2022年6月23日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

药物化学第二期：蛋白质-小分子对接Score函数总结

药物化学第二期：蛋白质-小分子对接Score函数总结

GenomicAI

30+阅读 · 2022年3月5日

医疗健康领域的短文本解析探索----文本纠错

医疗健康领域的短文本解析探索----文本纠错

深度学习自然语言处理

10+阅读 · 2020年8月5日

淘宝 at KDD 2020，提出M2GRL优化大规模推荐中的多任务多视角图表示学习

淘宝 at KDD 2020，提出M2GRL优化大规模推荐中的多任务多视角图表示学习

AINLP

23+阅读 · 2020年6月16日

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

THU数据派

10+阅读 · 2020年4月3日

自动特征工程在推荐系统中的研究

自动特征工程在推荐系统中的研究

DataFunTalk

10+阅读 · 2019年12月20日

TensorFlow官方发布剪枝优化工具：参数减少80%，精度几乎不变

TensorFlow官方发布剪枝优化工具：参数减少80%，精度几乎不变

量子位

11+阅读 · 2019年5月15日

入门 | 深度学习模型的简单优化技巧

入门 | 深度学习模型的简单优化技巧

机器之心

10+阅读 · 2018年6月10日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

超支化触发式自降解聚合物的设计合成与功能构筑

国家自然科学基金

0+阅读 · 2015年12月31日

基于本征正交分解的多学科设计优化场量耦合求解策略研究

国家自然科学基金

1+阅读 · 2015年12月31日

高选择性直接芳基化缩合聚合反应研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模分布式一致性最优化问题的结构型一阶求解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

结构张量与相位一致性联合约束的倾斜立体影像直线特征分级匹配

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于结构与序列信息的蛋白质-配体结合位点的预测

国家自然科学基金

8+阅读 · 2015年12月31日

植物分子设计中高维数据的低维稀疏逼近方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于片段的靶向拓扑异构酶I抗肿瘤新化学实体的设计、结构优化及其活性研究

国家自然科学基金

0+阅读 · 2014年12月31日

结核分枝杆菌中转录因子介导的耐药调控机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

InstructPro: Natural Language Guided Ligand-Binding Protein Design

Arxiv

0+阅读 · 3月2日

MolFORM: Preference-Aligned Multimodal Flow Matching for Structure-Based Drug Design

Arxiv

0+阅读 · 2月25日

Decoupling Strategy and Execution in Task-Focused Dialogue via Goal-Oriented Preference Optimization

Arxiv

0+阅读 · 2月20日

Retrieval-Augmented Foundation Models for Matched Molecular Pair Transformations to Recapitulate Medicinal Chemistry Intuition

Arxiv

0+阅读 · 2月18日

Curriculum-DPO++: Direct Preference Optimization via Data and Model Curricula for Text-to-Image Generation

Arxiv

0+阅读 · 2月13日

Mitigating Mismatch within Reference-based Preference Optimization

Arxiv

0+阅读 · 2月12日

Sample Efficient Generative Molecular Optimization with Joint Self-Improvement

Arxiv

0+阅读 · 2月11日

Uni-DPO: A Unified Paradigm for Dynamic Preference Optimization of LLMs

Arxiv

0+阅读 · 2月11日

Autoregressive Direct Preference Optimization

Arxiv

0+阅读 · 2月10日

SaDiT: Efficient Protein Backbone Design via Latent Structural Tokenization and Diffusion Transformers

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

3+阅读 · 今天3:12

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

4+阅读 · 今天3:00

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

2+阅读 · 今天2:56

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

2+阅读 · 今天2:44

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

4+阅读 · 今天2:37

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

专知会员服务

3+阅读 · 今天2:22

美海军“超配项目”

美海军“超配项目”

专知会员服务

4+阅读 · 今天2:13

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

10+阅读 · 4月21日

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

13+阅读 · 4月21日

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

7+阅读 · 4月21日

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

8+阅读 · 4月21日

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

10+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

相关VIP内容

《直接偏好优化研究综述》

《直接偏好优化研究综述》

专知会员服务

31+阅读 · 2025年3月18日

多样化偏好优化

多样化偏好优化

专知会员服务

12+阅读 · 2025年2月3日

直接偏好优化中的数据集、理论、变体和应用的综合综述

直接偏好优化中的数据集、理论、变体和应用的综合综述

专知会员服务

15+阅读 · 2024年10月24日

博士论文 | CMU 2024 | 用于特定目标药物设计的深度生成方法 170页

博士论文 | CMU 2024 | 用于特定目标药物设计的深度生成方法 170页

专知会员服务

13+阅读 · 2024年9月23日

【MIT博士论文】在结构约束下的机器学习优化方法, 257页pdf

【MIT博士论文】在结构约束下的机器学习优化方法, 257页pdf

专知会员服务

39+阅读 · 2023年8月6日

AI如何做药物设计？中科大最新《几何深度学习在基于结构的药物设计中》系统综述

AI如何做药物设计？中科大最新《几何深度学习在基于结构的药物设计中》系统综述

专知会员服务

24+阅读 · 2023年6月24日

基于深度学习和传统打分函数的配体构象优化框架

基于深度学习和传统打分函数的配体构象优化框架

专知会员服务

14+阅读 · 2023年1月9日

DiffSBDD：利用等变扩散模型进行基于结构的药物设计

DiffSBDD：利用等变扩散模型进行基于结构的药物设计

专知会员服务

14+阅读 · 2022年11月7日

基于结构的药物设计与几何深度学习

基于结构的药物设计与几何深度学习

专知会员服务

17+阅读 · 2022年10月31日

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

专知会员服务

11+阅读 · 2022年6月23日

热门VIP内容

开通专知VIP会员享更多权益服务

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

大语言模型平台在国防情报应用中的对比

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

相关资讯

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

药物化学第二期：蛋白质-小分子对接Score函数总结

药物化学第二期：蛋白质-小分子对接Score函数总结

GenomicAI

30+阅读 · 2022年3月5日

医疗健康领域的短文本解析探索----文本纠错

医疗健康领域的短文本解析探索----文本纠错

深度学习自然语言处理

10+阅读 · 2020年8月5日

淘宝 at KDD 2020，提出M2GRL优化大规模推荐中的多任务多视角图表示学习

淘宝 at KDD 2020，提出M2GRL优化大规模推荐中的多任务多视角图表示学习

AINLP

23+阅读 · 2020年6月16日

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

THU数据派

10+阅读 · 2020年4月3日

自动特征工程在推荐系统中的研究

自动特征工程在推荐系统中的研究

DataFunTalk

10+阅读 · 2019年12月20日

TensorFlow官方发布剪枝优化工具：参数减少80%，精度几乎不变

TensorFlow官方发布剪枝优化工具：参数减少80%，精度几乎不变

量子位

11+阅读 · 2019年5月15日

入门 | 深度学习模型的简单优化技巧

入门 | 深度学习模型的简单优化技巧

机器之心

10+阅读 · 2018年6月10日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

相关论文

InstructPro: Natural Language Guided Ligand-Binding Protein Design

Arxiv

0+阅读 · 3月2日

MolFORM: Preference-Aligned Multimodal Flow Matching for Structure-Based Drug Design

Arxiv

0+阅读 · 2月25日

Decoupling Strategy and Execution in Task-Focused Dialogue via Goal-Oriented Preference Optimization

Arxiv

0+阅读 · 2月20日

Retrieval-Augmented Foundation Models for Matched Molecular Pair Transformations to Recapitulate Medicinal Chemistry Intuition

Arxiv

0+阅读 · 2月18日

Curriculum-DPO++: Direct Preference Optimization via Data and Model Curricula for Text-to-Image Generation

Arxiv

0+阅读 · 2月13日

Mitigating Mismatch within Reference-based Preference Optimization

Arxiv

0+阅读 · 2月12日

Sample Efficient Generative Molecular Optimization with Joint Self-Improvement

Arxiv

0+阅读 · 2月11日

Uni-DPO: A Unified Paradigm for Dynamic Preference Optimization of LLMs

Arxiv

0+阅读 · 2月11日

Autoregressive Direct Preference Optimization

Arxiv

0+阅读 · 2月10日

SaDiT: Efficient Protein Backbone Design via Latent Structural Tokenization and Diffusion Transformers

Arxiv

0+阅读 · 2月6日

相关基金

超支化触发式自降解聚合物的设计合成与功能构筑

国家自然科学基金

0+阅读 · 2015年12月31日

基于本征正交分解的多学科设计优化场量耦合求解策略研究

国家自然科学基金

1+阅读 · 2015年12月31日

高选择性直接芳基化缩合聚合反应研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模分布式一致性最优化问题的结构型一阶求解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

结构张量与相位一致性联合约束的倾斜立体影像直线特征分级匹配

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于结构与序列信息的蛋白质-配体结合位点的预测

国家自然科学基金

8+阅读 · 2015年12月31日

植物分子设计中高维数据的低维稀疏逼近方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于片段的靶向拓扑异构酶I抗肿瘤新化学实体的设计、结构优化及其活性研究

国家自然科学基金

0+阅读 · 2014年12月31日

结核分枝杆菌中转录因子介导的耐药调控机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员