D-Flow: Multi-modality Flow Matching for D-peptide Design - 专知论文

会员服务 ·

0

设计 · 结构 · 多模 · 模态 · 生物 ·

D-Flow: Multi-modality Flow Matching for D-peptide Design

翻译：D-Flow：面向D-肽设计的多模态流匹配方法

Fang Wu,Fang Wu,Shuting Jin,Xiangru Tang,Junlin Xu,Mark Gerstein,James Zou

Proteins play crucial roles in biological processes, with therapeutic peptides emerging as promising pharmaceutical agents. They allow for new possibilities to leverage target binding sites that were previously undruggable. Although deep learning has advanced peptide discovery, generating D-proteins composed of D-amino acids remains challenging because of the scarcity of natural examples. This paper proposes D-Flow, a full-atom flow-based framework for de novo D-peptide design. D-Flow is conditioned on receptor binding and utilizes a comprehensive representation of peptide structure, incorporating backbone frames, side-chain angles, and discrete amino acid types. A mirror-image algorithm is implemented to address the lack of training data for D-proteins, which convert the chirality of L-receptors. Furthermore, we enhance D-Flow's capacity by integrating large protein language models with structural awareness through a lightweight structural adapter. A two-stage training pipeline and a controlling toolkit also enable D-Flow to transition from a general protein design to a targeted binder design while preserving pre-training knowledge. Extensive experimental results on the PepMerge benchmark demonstrate D-Flow's effectiveness, particularly in developing peptides with entire D-residues. This approach represents a significant advancement in computational D-peptide design, offering unique opportunities for bioorthogonal and stable molecular tools and diagnostics. The code is available in https://github.com/smiles724/PeptideDesign.

翻译：蛋白质在生物过程中扮演着关键角色，其中治疗性肽作为有前景的药物分子崭露头角。它们为利用先前难以成药的靶点结合位点提供了新的可能性。尽管深度学习已推动肽发现领域取得进展，但由于天然样本稀缺，生成由D-氨基酸构成的D-蛋白仍具挑战性。本文提出D-Flow，一种基于全原子流的从头设计D-肽框架。D-Flow以受体结合为条件，采用涵盖骨架框架、侧链角度和离散氨基酸类型的全面肽结构表征。为解决D-蛋白训练数据匮乏的问题，我们实现了镜像转换算法，该算法可转换L-受体的手性。此外，我们通过轻量级结构适配器整合具有结构感知能力的大规模蛋白质语言模型，从而增强D-Flow的建模能力。两阶段训练流程与控制工具包还使D-Flow能够从通用蛋白质设计转向靶向结合剂设计，同时保留预训练知识。在PepMerge基准测试上的大量实验结果证明了D-Flow的有效性，特别是在开发全D-残基肽方面。该方法代表了计算D-肽设计领域的重大进展，为生物正交且稳定的分子工具与诊断技术提供了独特机遇。代码发布于https://github.com/smiles724/PeptideDesign。

0

相关内容

设计是对现有状的一种重新认识和打破重组的过程，设计让一切变得更美。

【ICML2025】基于柔性条件的蛋白质结构设计与流匹配

【ICML2025】基于柔性条件的蛋白质结构设计与流匹配

专知会员服务

10+阅读 · 2025年8月26日

流匹配在生物学与生命科学中的应用综述

流匹配在生物学与生命科学中的应用综述

专知会员服务

16+阅读 · 2025年7月25日

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

专知会员服务

26+阅读 · 2022年10月12日

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

专知会员服务

11+阅读 · 2022年6月23日

南大清华等《深度学习蛋白质设计》综述论文，涵盖16页pdf153篇文献阐述DL在蛋白质结构与序列设计的方法

南大清华等《深度学习蛋白质设计》综述论文，涵盖16页pdf153篇文献阐述DL在蛋白质结构与序列设计的方法

专知会员服务

22+阅读 · 2022年6月1日

多模态深度学习在生物医学数据融合中的应用研究进展

多模态深度学习在生物医学数据融合中的应用研究进展

专知会员服务

62+阅读 · 2022年5月31日

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

专知会员服务

21+阅读 · 2022年3月14日

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

专知会员服务

17+阅读 · 2022年3月6日

【KDD2021】基于结构感知交互图神经网络的蛋白质-配体结合亲合性预测

专知会员服务

18+阅读 · 2021年7月23日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

科研圈

17+阅读 · 2019年10月30日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

泡泡机器人SLAM

41+阅读 · 2019年5月19日

从动力学角度看优化算法：GAN的第三个阶段

从动力学角度看优化算法：GAN的第三个阶段

PaperWeekly

11+阅读 · 2019年5月13日

寡肽生物水凝胶用于蛋白药物定位输送与控释的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于串联质谱数据的多肽鉴定半监督学习并行算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

含DOPA多肽双响应水凝胶体系的构建及在细胞培养中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于净电荷可逆调节的微环境敏感型细胞穿膜肽在两亲性载体材料功能化设计中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于阴离子交换色谱分级和功能化氧化石墨烯材料富集的N-磷酸化蛋白质组样品预处理新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

多通道非线性排泄模式的药物动力学的数学问题

国家自然科学基金

0+阅读 · 2015年12月31日

基于生物网络的共享肽归属及蛋白质定性算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于肽类分子的多组分共组装：理性设计、多级调控与生物应用

国家自然科学基金

2+阅读 · 2014年12月31日

DMFlow: Disordered Materials Generation by Flow Matching

Arxiv

0+阅读 · 2月4日

Repurposing Protein Language Models for Latent Flow-Based Fitness Optimization

Arxiv

0+阅读 · 2月2日

SplineFlow: Flow Matching for Dynamical Systems with B-Spline Interpolants

Arxiv

0+阅读 · 1月30日

SiDGen: Structure-informed Diffusion for Generative modeling of Ligands for Proteins

Arxiv

0+阅读 · 1月29日

DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion

Arxiv

0+阅读 · 1月29日

PepEDiff: Zero-Shot Peptide Binder Design via Protein Embedding Diffusion

Arxiv

0+阅读 · 1月19日

DeFlow: Decoupling Manifold Modeling and Value Maximization for Offline Policy Extraction

Arxiv

0+阅读 · 1月15日

Low-dimensional semi-supervised latent Bayesian optimization for designing antimicrobial peptides

Arxiv

0+阅读 · 1月9日

Surface-based Molecular Design with Multi-modal Flow Matching

Arxiv

0+阅读 · 1月8日

Flow Matching and Diffusion Models via PointNet for Generating Fluid Fields on Irregular Geometries

Arxiv

0+阅读 · 1月6日

VIP会员

文章信息

相关主题

最新内容

【博士论文】基于物理结构与贝叶斯不确定性的可靠神经网络

【博士论文】基于物理结构与贝叶斯不确定性的可靠神经网络

专知会员服务

8+阅读 · 6月4日

AgentOps综述：智能体系统运维框架

AgentOps综述：智能体系统运维框架

专知会员服务

12+阅读 · 6月4日

《美陆军最新条令：兵力防护》

《美陆军最新条令：兵力防护》

专知会员服务

9+阅读 · 6月4日

《军用物联网：架构、应用、挑战与现代战争中的战略意义》

《军用物联网：架构、应用、挑战与现代战争中的战略意义》

专知会员服务

8+阅读 · 6月4日

《人工智能的挑战：算法战的想象与现实》

《人工智能的挑战：算法战的想象与现实》

专知会员服务

11+阅读 · 6月4日

《自适应智能：融合数字孪生精准性与人工智能预见力，实现实时决策》

《自适应智能：融合数字孪生精准性与人工智能预见力，实现实时决策》

专知会员服务

13+阅读 · 6月4日

首场人工智能战争：Maven如何重塑武装冲突

首场人工智能战争：Maven如何重塑武装冲突

专知会员服务

7+阅读 · 6月4日

【博士论文】抽象信息论与安全奖励学习的数学发展

【博士论文】抽象信息论与安全奖励学习的数学发展

专知会员服务

9+阅读 · 6月3日

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

专知会员服务

6+阅读 · 6月3日

《推进军事决策支持：运用强化学习驱动仿真的稳健作战计划验证》

《推进军事决策支持：运用强化学习驱动仿真的稳健作战计划验证》

专知会员服务

12+阅读 · 6月3日

详解人工智能赋能战争的旗舰软件平台：Maven智能系统

详解人工智能赋能战争的旗舰软件平台：Maven智能系统

专知会员服务

22+阅读 · 6月3日

《发展用于决策支持的化生放核（CBRN）态势理解》

《发展用于决策支持的化生放核（CBRN）态势理解》

专知会员服务

8+阅读 · 6月3日

《通往人工通用智能之路上的均衡策略》

《通往人工通用智能之路上的均衡策略》

专知会员服务

7+阅读 · 6月3日

《人工智能与军事整合：现状与未来风险》报告

《人工智能与军事整合：现状与未来风险》报告

专知会员服务

5+阅读 · 6月3日

《Palantir的科技生态系统》

《Palantir的科技生态系统》

专知会员服务

21+阅读 · 6月2日

相关VIP内容

【ICML2025】基于柔性条件的蛋白质结构设计与流匹配

【ICML2025】基于柔性条件的蛋白质结构设计与流匹配

专知会员服务

10+阅读 · 2025年8月26日

流匹配在生物学与生命科学中的应用综述

流匹配在生物学与生命科学中的应用综述

专知会员服务

16+阅读 · 2025年7月25日

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

深度学习如何用于蛋白质？微软最新《多模态深度学习的蛋白质工程》报告，附300页ppt与视频

专知会员服务

26+阅读 · 2022年10月12日

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

专知会员服务

11+阅读 · 2022年6月23日

南大清华等《深度学习蛋白质设计》综述论文，涵盖16页pdf153篇文献阐述DL在蛋白质结构与序列设计的方法

南大清华等《深度学习蛋白质设计》综述论文，涵盖16页pdf153篇文献阐述DL在蛋白质结构与序列设计的方法

专知会员服务

22+阅读 · 2022年6月1日

多模态深度学习在生物医学数据融合中的应用研究进展

多模态深度学习在生物医学数据融合中的应用研究进展

专知会员服务

62+阅读 · 2022年5月31日

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

专知会员服务

21+阅读 · 2022年3月14日

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

专知会员服务

17+阅读 · 2022年3月6日

【KDD2021】基于结构感知交互图神经网络的蛋白质-配体结合亲合性预测

专知会员服务

18+阅读 · 2021年7月23日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

热门VIP内容

开通专知VIP会员享更多权益服务

AgentOps综述：智能体系统运维框架

《军用物联网：架构、应用、挑战与现代战争中的战略意义》

【博士论文】基于物理结构与贝叶斯不确定性的可靠神经网络

《美陆军最新条令：兵力防护》

相关资讯

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

科研圈

17+阅读 · 2019年10月30日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

泡泡机器人SLAM

41+阅读 · 2019年5月19日

从动力学角度看优化算法：GAN的第三个阶段

从动力学角度看优化算法：GAN的第三个阶段

PaperWeekly

11+阅读 · 2019年5月13日

相关论文

DMFlow: Disordered Materials Generation by Flow Matching

Arxiv

0+阅读 · 2月4日

Repurposing Protein Language Models for Latent Flow-Based Fitness Optimization

Arxiv

0+阅读 · 2月2日

SplineFlow: Flow Matching for Dynamical Systems with B-Spline Interpolants

Arxiv

0+阅读 · 1月30日

SiDGen: Structure-informed Diffusion for Generative modeling of Ligands for Proteins

Arxiv

0+阅读 · 1月29日

DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion

Arxiv

0+阅读 · 1月29日

PepEDiff: Zero-Shot Peptide Binder Design via Protein Embedding Diffusion

Arxiv

0+阅读 · 1月19日

DeFlow: Decoupling Manifold Modeling and Value Maximization for Offline Policy Extraction

Arxiv

0+阅读 · 1月15日

Low-dimensional semi-supervised latent Bayesian optimization for designing antimicrobial peptides

Arxiv

0+阅读 · 1月9日

Surface-based Molecular Design with Multi-modal Flow Matching

Arxiv

0+阅读 · 1月8日

Flow Matching and Diffusion Models via PointNet for Generating Fluid Fields on Irregular Geometries

Arxiv

0+阅读 · 1月6日

相关基金

寡肽生物水凝胶用于蛋白药物定位输送与控释的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于串联质谱数据的多肽鉴定半监督学习并行算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

含DOPA多肽双响应水凝胶体系的构建及在细胞培养中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于净电荷可逆调节的微环境敏感型细胞穿膜肽在两亲性载体材料功能化设计中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于阴离子交换色谱分级和功能化氧化石墨烯材料富集的N-磷酸化蛋白质组样品预处理新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

多通道非线性排泄模式的药物动力学的数学问题

国家自然科学基金

0+阅读 · 2015年12月31日

基于生物网络的共享肽归属及蛋白质定性算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于肽类分子的多组分共组装：理性设计、多级调控与生物应用

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员