Proteins play crucial roles in biological processes, with therapeutic peptides emerging as promising pharmaceutical agents. They allow for new possibilities to leverage target binding sites that were previously undruggable. Although deep learning has advanced peptide discovery, generating D-proteins composed of D-amino acids remains challenging because of the scarcity of natural examples. This paper proposes D-Flow, a full-atom flow-based framework for de novo D-peptide design. D-Flow is conditioned on receptor binding and utilizes a comprehensive representation of peptide structure, incorporating backbone frames, side-chain angles, and discrete amino acid types. A mirror-image algorithm is implemented to address the lack of training data for D-proteins, which convert the chirality of L-receptors. Furthermore, we enhance D-Flow's capacity by integrating large protein language models with structural awareness through a lightweight structural adapter. A two-stage training pipeline and a controlling toolkit also enable D-Flow to transition from a general protein design to a targeted binder design while preserving pre-training knowledge. Extensive experimental results on the PepMerge benchmark demonstrate D-Flow's effectiveness, particularly in developing peptides with entire D-residues. This approach represents a significant advancement in computational D-peptide design, offering unique opportunities for bioorthogonal and stable molecular tools and diagnostics. The code is available in https://github.com/smiles724/PeptideDesign.


翻译:蛋白质在生物过程中扮演着关键角色,其中治疗性肽作为有前景的药物分子崭露头角。它们为利用先前难以成药的靶点结合位点提供了新的可能性。尽管深度学习已推动肽发现领域取得进展,但由于天然样本稀缺,生成由D-氨基酸构成的D-蛋白仍具挑战性。本文提出D-Flow,一种基于全原子流的从头设计D-肽框架。D-Flow以受体结合为条件,采用涵盖骨架框架、侧链角度和离散氨基酸类型的全面肽结构表征。为解决D-蛋白训练数据匮乏的问题,我们实现了镜像转换算法,该算法可转换L-受体的手性。此外,我们通过轻量级结构适配器整合具有结构感知能力的大规模蛋白质语言模型,从而增强D-Flow的建模能力。两阶段训练流程与控制工具包还使D-Flow能够从通用蛋白质设计转向靶向结合剂设计,同时保留预训练知识。在PepMerge基准测试上的大量实验结果证明了D-Flow的有效性,特别是在开发全D-残基肽方面。该方法代表了计算D-肽设计领域的重大进展,为生物正交且稳定的分子工具与诊断技术提供了独特机遇。代码发布于https://github.com/smiles724/PeptideDesign。

0
下载
关闭预览

相关内容

设计是对现有状的一种重新认识和打破重组的过程,设计让一切变得更美。
【ICML2025】基于柔性条件的蛋白质结构设计与流匹配
专知会员服务
10+阅读 · 2025年8月26日
流匹配在生物学与生命科学中的应用综述
专知会员服务
16+阅读 · 2025年7月25日
多模态深度学习在生物医学数据融合中的应用研究进展
专知会员服务
62+阅读 · 2022年5月31日
谷歌EfficientNet缩放模型,PyTorch实现登热榜
机器学习算法与Python学习
11+阅读 · 2019年6月4日
【泡泡点云时空】FlowNet3D:学习三维点云中的场景流
泡泡机器人SLAM
41+阅读 · 2019年5月19日
从动力学角度看优化算法:GAN的第三个阶段
PaperWeekly
11+阅读 · 2019年5月13日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关VIP内容
【ICML2025】基于柔性条件的蛋白质结构设计与流匹配
专知会员服务
10+阅读 · 2025年8月26日
流匹配在生物学与生命科学中的应用综述
专知会员服务
16+阅读 · 2025年7月25日
多模态深度学习在生物医学数据融合中的应用研究进展
专知会员服务
62+阅读 · 2022年5月31日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员