We present PepEDiff, a novel peptide binder generator that designs binding sequences given a target receptor protein sequence and its pocket residues. Peptide binder generation is critical in therapeutic and biochemical applications, yet many existing methods rely heavily on intermediate structure prediction, adding complexity and limiting sequence diversity. Our approach departs from this paradigm by generating binder sequences directly in a continuous latent space derived from a pretrained protein embedding model, without relying on predicted structures, thereby improving structural and sequence diversity. To encourage the model to capture binding-relevant features rather than memorizing known sequences, we perform latent-space exploration and diffusion-based sampling, enabling the generation of peptides beyond the limited distribution of known binders. This zero-shot generative strategy leverages the global protein embedding manifold as a semantic prior, allowing the model to propose novel peptide sequences in previously unseen regions of the protein space. We evaluate PepEDiff on TIGIT, a challenging target with a large, flat protein-protein interaction interface that lacks a druggable pocket. Despite its simplicity, our method outperforms state-of-the-art approaches across benchmark tests and in the TIGIT case study, demonstrating its potential as a general, structure-free framework for zero-shot peptide binder design. The code for this research is available at GitHub: https://github.com/LabJunBMI/PepEDiff-An-Peptide-binder-Embedding-Diffusion-Model


翻译:我们提出PepEDiff,一种新颖的肽段结合剂生成器,能够根据给定的目标受体蛋白序列及其口袋残基设计结合序列。肽段结合剂生成在治疗和生化应用中至关重要,然而许多现有方法严重依赖中间结构预测,增加了复杂性并限制了序列多样性。我们的方法突破了这一范式,直接在源自预训练蛋白质嵌入模型的连续潜在空间中生成结合剂序列,无需依赖预测结构,从而提高了结构和序列多样性。为促使模型捕获结合相关特征而非记忆已知序列,我们进行潜在空间探索和基于扩散的采样,从而能够生成超出已知结合剂有限分布的肽段。这种零样本生成策略利用全局蛋白质嵌入流形作为语义先验,使模型能够在蛋白质空间先前未见区域提出新颖的肽序列。我们在TIGIT上评估PepEDiff,这是一个具有大而平坦的蛋白质-蛋白质相互作用界面且缺乏可成药口袋的挑战性靶点。尽管方法简洁,我们的模型在基准测试和TIGIT案例研究中均优于最先进方法,证明了其作为通用的、无结构零样本肽段结合剂设计框架的潜力。本研究的代码可在GitHub获取:https://github.com/LabJunBMI/PepEDiff-An-Peptide-binder-Embedding-Diffusion-Model

0
下载
关闭预览

相关内容

数学上,序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。
【ICML2025】基于柔性条件的蛋白质结构设计与流匹配
专知会员服务
10+阅读 · 2025年8月26日
【NeurIPS2023】基于迭代优化的全原子蛋白质口袋设计
专知会员服务
13+阅读 · 2023年10月8日
PubMed GPT : 用于生物医学文本的特定领域大型语言模型
专知会员服务
38+阅读 · 2022年12月19日
DiffSBDD:利用等变扩散模型进行基于结构的药物设计
专知会员服务
14+阅读 · 2022年11月7日
GraphBP:3D空间中的靶向分子生成
专知会员服务
12+阅读 · 2022年9月27日
Science | ProteinMPNN : 基于深度学习的蛋白序列设计
专知会员服务
12+阅读 · 2022年9月18日
【MBSE】基于MBSE的正向设计和产品创新
产业智能官
20+阅读 · 2020年5月1日
CVPR2019教程《胶囊网络(Capsule Networks)综述》,附93页PPT
GAN生成式对抗网络
29+阅读 · 2019年6月21日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
2+阅读 · 5月31日
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
6+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
7+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
19+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
11+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
专知会员服务
10+阅读 · 5月30日
Top
微信扫码咨询专知VIP会员