Common deep learning approaches for antibody engineering focus on modeling the marginal distribution of sequences. By treating sequences as independent samples, however, these methods overlook affinity maturation as a rich and largely untapped source of information about the evolutionary process by which antibodies explore the underlying fitness landscape. In contrast, classical phylogenetic models explicitly represent evolutionary dynamics but lack the expressivity to capture complex epistatic interactions. We bridge this gap with CoSiNE, a continuous-time Markov chain parameterized by a deep neural network. Mathematically, we prove that CoSiNE provides a first-order approximation to the intractable sequential point mutation process, capturing epistatic effects with an error bound that is quadratic in branch length. Empirically, CoSiNE outperforms state-of-the-art language models in zero-shot variant effect prediction by explicitly disentangling selection from context-dependent somatic hypermutation. Finally, we introduce Guided Gillespie, a classifier-guided sampling scheme that steers CoSiNE at inference time, enabling efficient optimization of antibody binding affinity toward specific antigens.


翻译:当前抗体工程中常见的深度学习方法主要聚焦于序列边缘分布的建模。然而,这些方法将序列视为独立样本,忽视了亲和力成熟过程——这一过程作为抗体探索底层适应度景观的进化机制,蕴含着丰富且尚未被充分利用的信息。相比之下,经典系统发育模型虽能明确表征进化动力学,却缺乏捕捉复杂上位相互作用的表现能力。我们通过CoSiNE(一种由深度神经网络参数化的连续时间马尔可夫链)来弥合这一差距。在数学上,我们证明CoSiNE为难以处理的连续点突变过程提供了一阶近似,其捕捉上位效应的误差界限与分支长度的平方成正比。实证研究表明,CoSiNE通过显式解耦自然选择与上下文依赖的体细胞超突变,在零样本变异效应预测任务中超越了当前最先进的语言模型。最后,我们提出引导式吉莱斯皮采样方案,该方案在推理阶段引导CoSiNE的生成过程,实现了针对特定抗原的抗体结合亲和力高效优化。

0
下载
关闭预览

相关内容

数学上,序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。
专知会员服务
41+阅读 · 2021年3月3日
【学科交叉】抗生素发现的深度学习方法
专知会员服务
25+阅读 · 2020年2月23日
抗体可开发性评估与优化
GenomicAI
12+阅读 · 2022年6月12日
一文看懂AutoEncoder模型演进图谱
AINLP
12+阅读 · 2019年6月17日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
最新《生成式对抗网络GAN进展》论文
专知
95+阅读 · 2019年4月5日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
16+阅读 · 2018年7月26日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
《Palantir的科技生态系统》
专知会员服务
1+阅读 · 今天15:23
《反无人机系统传感器融合》90页报告
专知会员服务
4+阅读 · 今天14:57
运用人工智能与卫星通信驱散“战争迷雾”
专知会员服务
2+阅读 · 今天14:45
ACL 2026 | LLMSurgeon:从生成文本诊断大模型训练数据
【综述】世界模型:架构、方法、推理与应用全景
综述 | OPSD:大语言模型的在线策略自蒸馏
专知会员服务
4+阅读 · 6月1日
帕兰蒂尔Maven:军事人工智能的新纪元
专知会员服务
8+阅读 · 6月1日
相关VIP内容
专知会员服务
41+阅读 · 2021年3月3日
【学科交叉】抗生素发现的深度学习方法
专知会员服务
25+阅读 · 2020年2月23日
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员