MolFORM: Preference-Aligned Multimodal Flow Matching for Structure-Based Drug Design - 专知论文

会员服务 ·

0

对齐 · 结构 · 多模 · 模态 · 设计 ·

MolFORM: Preference-Aligned Multimodal Flow Matching for Structure-Based Drug Design

翻译：MolFORM：面向结构药物设计的偏好对齐多模态流匹配

Daiheng Zhang,Zhao Zhang

Structure-based drug design (SBDD) aims to efficiently discover high-affinity ligands within vast chemical spaces. However, current generative models struggle with objective misalignment and rigid sampling budgets. We present MolFORM, a fast multi-modal flow matching framework for discrete atom types and continuous coordinates. Crucially, to bridge the gap between generative capability and biochemical objectives, we introduce two distinct post-training strategies: (1) Direct Preference Optimization (DPO), which performs offline alignment using ranked preference pairs; and (2) an online reinforcement learning paradigm that optimizes the generative flow directly on the forward process. Both strategies effectively navigate the chemical space toward high-affinity regions. MolFORM achieves state-of-the-art results on the CrossDocked2020 benchmark (Vina Score -7.60, Diversity 0.75), demonstrating that incorporating preference alignment mechanisms-whether via offline optimization or online reinforcement-is crucial for steering generative models toward high-affinity binding regions. The source code for MolFORM is publicly available at https://github.com/daiheng-zhang/SBDD-MolFORM.

翻译：结构药物设计旨在从广阔的化学空间中高效发现高亲和力配体。然而，现有生成模型普遍面临目标错位与采样预算僵化的问题。本文提出MolFORM，一种针对离散原子类型与连续坐标的快速多模态流匹配框架。关键之处在于，为弥合生成能力与生化目标之间的鸿沟，我们引入了两种不同的后训练策略：（1）直接偏好优化，利用排序偏好对进行离线对齐；（2）在线强化学习范式，直接在正向过程上优化生成流。两种策略均能有效引导化学空间探索至高亲和力区域。MolFORM在CrossDocked2020基准测试中取得领先成果（Vina评分-7.60，多样性0.75），证明无论是通过离线优化还是在线强化学习，整合偏好对齐机制对于引导生成模型聚焦高亲和力结合区域具有关键作用。MolFORM源代码已公开于https://github.com/daiheng-zhang/SBDD-MolFORM。

0

相关内容

【WWW2026】用于多模态推荐的基础模型个性化参数高效微调研究

【WWW2026】用于多模态推荐的基础模型个性化参数高效微调研究

专知会员服务

5+阅读 · 2月20日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

多模态对齐如何做？国防科大等最新《如何弥合模态间的差距：多模态大型语言模型》综述四大类型多模态对齐方法

多模态对齐如何做？国防科大等最新《如何弥合模态间的差距：多模态大型语言模型》综述四大类型多模态对齐方法

专知会员服务

74+阅读 · 2023年11月18日

AI如何做药物设计？中科大最新《几何深度学习在基于结构的药物设计中》系统综述

AI如何做药物设计？中科大最新《几何深度学习在基于结构的药物设计中》系统综述

专知会员服务

24+阅读 · 2023年6月24日

基于深度学习和传统打分函数的配体构象优化框架

基于深度学习和传统打分函数的配体构象优化框架

专知会员服务

14+阅读 · 2023年1月9日

DiffSBDD：利用等变扩散模型进行基于结构的药物设计

DiffSBDD：利用等变扩散模型进行基于结构的药物设计

专知会员服务

14+阅读 · 2022年11月7日

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

专知会员服务

11+阅读 · 2022年6月23日

【ICML2022】药物结合结构预测的几何深度学习

【ICML2022】药物结合结构预测的几何深度学习

专知会员服务

26+阅读 · 2022年5月24日

【WWW2021】多视角图对比学习的药物药物交互预测

【WWW2021】多视角图对比学习的药物药物交互预测

专知会员服务

54+阅读 · 2021年1月29日

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

专知会员服务

36+阅读 · 2019年12月12日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

专知

22+阅读 · 2022年4月12日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

专知

23+阅读 · 2018年1月18日

基于金属卟啉结构基元的微纳尺度MOFs的构建及其多相催化氧化性质的研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有诊疗一体化的多模靶向MOFs新探针的制备及其影像学评价

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

多通道非线性排泄模式的药物动力学的数学问题

国家自然科学基金

0+阅读 · 2015年12月31日

MOFs纳米粒子的制备及其对不相容共混物相结构的调控与稳定作用

国家自然科学基金

0+阅读 · 2015年12月31日

基于TRPV1三维结构的新型镇痛药物的设计、合成及镇痛作用研究

国家自然科学基金

0+阅读 · 2015年12月31日

金属有机框架（MOFs）材料的构筑、纳米化及光学性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

多喷嘴对置式Fenton脱硝反应器的液滴对撞混合反应机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于肽类分子的多组分共组装：理性设计、多级调控与生物应用

国家自然科学基金

2+阅读 · 2014年12月31日

PILL-CoDe: Inverse Design of Polypills via Automatic Differentiation for Prescribed Drug-Release Kinetics

Arxiv

0+阅读 · 5月4日

D-Flow: Multi-modality Flow Matching for D-peptide Design

Arxiv

0+阅读 · 5月1日

MedFlowSeg: Flow Matching for Medical Image Segmentation with Frequency-Aware Attention

Arxiv

0+阅读 · 4月21日

Prior-Fitted Functional Flow: In-Context Generative Models for Pharmacokinetics

Arxiv

0+阅读 · 4月19日

FlowIt: Global Matching for Optical Flow with Confidence-Guided Refinement

Arxiv

0+阅读 · 3月30日

SpectraLLM: Uncovering the Ability of LLMs for Molecule Structure Elucidation from Multi-Spectral

Arxiv

0+阅读 · 3月21日

MOSAIC: Multi-Objective Slice-Aware Iterative Curation for Alignment

Arxiv

0+阅读 · 3月19日

Omni-Diffusion: Unified Multimodal Understanding and Generation with Masked Discrete Diffusion

Arxiv

0+阅读 · 3月6日

Active Flow Matching

Arxiv

0+阅读 · 3月1日

DesignBench: A Comprehensive Benchmark for MLLM-based Front-end Code Generation

Arxiv

0+阅读 · 2月24日

VIP会员

文章信息

相关主题

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

0+阅读 · 38分钟前

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

0+阅读 · 39分钟前

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

3+阅读 · 今天14:04

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

3+阅读 · 今天13:54

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

6+阅读 · 今天13:49

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

4+阅读 · 今天13:38

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

5+阅读 · 今天13:37

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

5+阅读 · 今天13:11

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

10+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

5+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

5+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

7+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

5+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

8+阅读 · 5月29日

相关VIP内容

【WWW2026】用于多模态推荐的基础模型个性化参数高效微调研究

【WWW2026】用于多模态推荐的基础模型个性化参数高效微调研究

专知会员服务

5+阅读 · 2月20日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

多模态对齐如何做？国防科大等最新《如何弥合模态间的差距：多模态大型语言模型》综述四大类型多模态对齐方法

多模态对齐如何做？国防科大等最新《如何弥合模态间的差距：多模态大型语言模型》综述四大类型多模态对齐方法

专知会员服务

74+阅读 · 2023年11月18日

AI如何做药物设计？中科大最新《几何深度学习在基于结构的药物设计中》系统综述

AI如何做药物设计？中科大最新《几何深度学习在基于结构的药物设计中》系统综述

专知会员服务

24+阅读 · 2023年6月24日

基于深度学习和传统打分函数的配体构象优化框架

基于深度学习和传统打分函数的配体构象优化框架

专知会员服务

14+阅读 · 2023年1月9日

DiffSBDD：利用等变扩散模型进行基于结构的药物设计

DiffSBDD：利用等变扩散模型进行基于结构的药物设计

专知会员服务

14+阅读 · 2022年11月7日

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

专知会员服务

11+阅读 · 2022年6月23日

【ICML2022】药物结合结构预测的几何深度学习

【ICML2022】药物结合结构预测的几何深度学习

专知会员服务

26+阅读 · 2022年5月24日

【WWW2021】多视角图对比学习的药物药物交互预测

【WWW2021】多视角图对比学习的药物药物交互预测

专知会员服务

54+阅读 · 2021年1月29日

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

专知会员服务

36+阅读 · 2019年12月12日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

专知

22+阅读 · 2022年4月12日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

专知

23+阅读 · 2018年1月18日

相关论文

PILL-CoDe: Inverse Design of Polypills via Automatic Differentiation for Prescribed Drug-Release Kinetics

Arxiv

0+阅读 · 5月4日

D-Flow: Multi-modality Flow Matching for D-peptide Design

Arxiv

0+阅读 · 5月1日

MedFlowSeg: Flow Matching for Medical Image Segmentation with Frequency-Aware Attention

Arxiv

0+阅读 · 4月21日

Prior-Fitted Functional Flow: In-Context Generative Models for Pharmacokinetics

Arxiv

0+阅读 · 4月19日

FlowIt: Global Matching for Optical Flow with Confidence-Guided Refinement

Arxiv

0+阅读 · 3月30日

SpectraLLM: Uncovering the Ability of LLMs for Molecule Structure Elucidation from Multi-Spectral

Arxiv

0+阅读 · 3月21日

MOSAIC: Multi-Objective Slice-Aware Iterative Curation for Alignment

Arxiv

0+阅读 · 3月19日

Omni-Diffusion: Unified Multimodal Understanding and Generation with Masked Discrete Diffusion

Arxiv

0+阅读 · 3月6日

Active Flow Matching

Arxiv

0+阅读 · 3月1日

DesignBench: A Comprehensive Benchmark for MLLM-based Front-end Code Generation

Arxiv

0+阅读 · 2月24日

相关基金

基于金属卟啉结构基元的微纳尺度MOFs的构建及其多相催化氧化性质的研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有诊疗一体化的多模靶向MOFs新探针的制备及其影像学评价

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

多通道非线性排泄模式的药物动力学的数学问题

国家自然科学基金

0+阅读 · 2015年12月31日

MOFs纳米粒子的制备及其对不相容共混物相结构的调控与稳定作用

国家自然科学基金

0+阅读 · 2015年12月31日

基于TRPV1三维结构的新型镇痛药物的设计、合成及镇痛作用研究

国家自然科学基金

0+阅读 · 2015年12月31日

金属有机框架（MOFs）材料的构筑、纳米化及光学性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

多喷嘴对置式Fenton脱硝反应器的液滴对撞混合反应机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于肽类分子的多组分共组装：理性设计、多级调控与生物应用

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员