Protein inverse folding, the task of predicting amino acid sequences for desired structures, is pivotal for de novo protein design. However, existing GNN-based methods typically suffer from restricted receptive fields that miss long-range dependencies and a "single-pass" inference paradigm that leads to error accumulation. To address these bottlenecks, we propose RIGA-Fold, a framework that synergizes Recurrent Interaction with Geometric Awareness. At the micro-level, we introduce a Geometric Attention Update (GAU) module where edge features explicitly serve as attention keys, ensuring strictly SE(3)-invariant local encoding. At the macro-level, we design an attention-based Global Context Bridge that acts as a soft gating mechanism to dynamically inject global topological information. Furthermore, to bridge the gap between structural and sequence modalities, we introduce an enhanced variant, RIGA-Fold*, which integrates trainable geometric features with frozen evolutionary priors from ESM-2 and ESM-IF via a dual-stream architecture. Finally, a biologically inspired ``predict-recycle-refine'' strategy is implemented to iteratively denoise sequence distributions. Extensive experiments on CATH 4.2, TS50, and TS500 benchmarks demonstrate that our geometric framework is highly competitive, while RIGA-Fold* significantly outperforms state-of-the-art baselines in both sequence recovery and structural consistency.


翻译:蛋白质逆折叠,即预测目标结构对应氨基酸序列的任务,是蛋白质从头设计的关键。然而,现有的基于图神经网络的方法通常存在感受野受限而忽略长程依赖,以及“单次”推理范式导致误差累积的问题。为解决这些瓶颈,我们提出了RIGA-Fold,一个协同融合循环交互与几何感知的框架。在微观层面,我们引入了几何注意力更新模块,其中边特征显式地作为注意力键,确保了严格的SE(3)不变局部编码。在宏观层面,我们设计了一个基于注意力的全局上下文桥接模块,作为一个软门控机制,动态注入全局拓扑信息。此外,为弥合结构与序列模态之间的鸿沟,我们引入了一个增强变体RIGA-Fold*,它通过双流架构将可训练的几何特征与来自ESM-2和ESM-IF的冻结进化先验知识相结合。最后,我们实现了一种受生物学启发的“预测-循环-精修”策略,以迭代地对序列分布进行去噪。在CATH 4.2、TS50和TS500基准测试上的大量实验表明,我们的几何框架具有高度竞争力,而RIGA-Fold*在序列恢复率和结构一致性方面均显著优于最先进的基线方法。

0
下载
关闭预览

相关内容

数学上,序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。
基于人工智能(AI)的蛋白结构预测工具合集
专知会员服务
10+阅读 · 2022年8月25日
【ICML2022】模型指导下的蛋白质序列设计的近端探索
专知会员服务
11+阅读 · 2022年7月10日
AlphaFold教程与最新蛋白质结构预测进展,附视频与Slides
专知会员服务
29+阅读 · 2022年6月16日
DeepMind《AlphaFold2蛋白质结构预测》CASP14介绍报告,42页ppt
【GNN】R-GCN:GCN 在知识图谱中的应用
深度学习自然语言处理
11+阅读 · 2020年5月4日
【学界】DeepMind论文:深度压缩感知,新框架提升GAN性能
GAN生成式对抗网络
14+阅读 · 2019年5月23日
GAFT:一个使用 Python 实现的遗传算法框架
Python开发者
10+阅读 · 2017年8月1日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员