Diffusion models have achieved promising results for Structure-Based Drug Design (SBDD). Nevertheless, high-quality protein subpocket and ligand data are relatively scarce, which hinders the models' generation capabilities. Recently, Direct Preference Optimization (DPO) has emerged as a pivotal tool for aligning generative models with human preferences. In this paper, we propose DecompDPO, a structure-based optimization method aligns diffusion models with pharmaceutical needs using multi-granularity preference pairs. DecompDPO introduces decomposition into the optimization objectives and obtains preference pairs at the molecule or decomposed substructure level based on each objective's decomposability. Additionally, DecompDPO introduces a physics-informed energy term to ensure reasonable molecular conformations in the optimization results. Notably, DecompDPO can be effectively used for two main purposes: (1) fine-tuning pretrained diffusion models for molecule generation across various protein families, and (2) molecular optimization given a specific protein subpocket after generation. Extensive experiments on the CrossDocked2020 benchmark show that DecompDPO significantly improves model performance, achieving up to 95.2% Med. High Affinity and a 36.2% success rate for molecule generation, and 100% Med. High Affinity and a 52.1% success rate for molecular optimization. Code is available at https://github.com/laviaf/DecompDPO.


翻译:扩散模型在基于结构的药物设计领域已取得显著成果。然而,高质量蛋白质亚口袋与配体数据相对稀缺,制约了模型的生成能力。近期,直接偏好优化已成为使生成模型与人类偏好对齐的关键工具。本文提出DecompDPO——一种基于结构的优化方法,通过多粒度偏好配对使扩散模型与药物研发需求对齐。该方法将分解机制引入优化目标,根据各目标的可分解性在分子或分解子结构层面构建偏好对。此外,DecompDPO引入物理信息能量项以确保优化结果中分子构象的合理性。值得注意的是,该方法可有效应用于两大场景:(1)针对不同蛋白质家族进行分子生成的预训练扩散模型微调;(2)在特定蛋白质亚口袋条件下对生成分子进行优化。在CrossDocked2020基准测试上的大量实验表明,DecompDPO显著提升了模型性能:在分子生成任务中达到95.2%的中高亲和力与36.2%的成功率,在分子优化任务中实现100%的中高亲和力与52.1%的成功率。代码已开源:https://github.com/laviaf/DecompDPO。

0
下载
关闭预览

相关内容

《直接偏好优化研究综述》
专知会员服务
31+阅读 · 2025年3月18日
多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
直接偏好优化中的数据集、理论、变体和应用的综合综述
专知会员服务
15+阅读 · 2024年10月24日
基于深度学习和传统打分函数的配体构象优化框架
专知会员服务
14+阅读 · 2023年1月9日
DiffSBDD:利用等变扩散模型进行基于结构的药物设计
专知会员服务
14+阅读 · 2022年11月7日
基于结构的药物设计与几何深度学习
专知会员服务
17+阅读 · 2022年10月31日
医疗健康领域的短文本解析探索----文本纠错
深度学习自然语言处理
10+阅读 · 2020年8月5日
自动特征工程在推荐系统中的研究
DataFunTalk
10+阅读 · 2019年12月20日
入门 | 深度学习模型的简单优化技巧
机器之心
10+阅读 · 2018年6月10日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
《直接偏好优化研究综述》
专知会员服务
31+阅读 · 2025年3月18日
多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
直接偏好优化中的数据集、理论、变体和应用的综合综述
专知会员服务
15+阅读 · 2024年10月24日
基于深度学习和传统打分函数的配体构象优化框架
专知会员服务
14+阅读 · 2023年1月9日
DiffSBDD:利用等变扩散模型进行基于结构的药物设计
专知会员服务
14+阅读 · 2022年11月7日
基于结构的药物设计与几何深度学习
专知会员服务
17+阅读 · 2022年10月31日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员