RIGA-Fold: A General Framework for Protein Inverse Folding via Recurrent Interaction and Geometric Awareness - 专知论文

会员服务 ·

0

序列 · 交互 · 几何感知 · 结构 · 通用框架 ·

RIGA-Fold: A General Framework for Protein Inverse Folding via Recurrent Interaction and Geometric Awareness

翻译：RIGA-Fold：一种通过循环交互与几何感知实现蛋白质逆折叠的通用框架

Sisi Yuan,Jiehuang Chen,Junchuang Cai,Dong Xu,Xueliang Li,Zexuan Zhu,Junkai Ji

from arxiv, 16 pages, 4 figures. Includes appendix. Preprint under review

Protein inverse folding, the task of predicting amino acid sequences for desired structures, is pivotal for de novo protein design. However, existing GNN-based methods typically suffer from restricted receptive fields that miss long-range dependencies and a "single-pass" inference paradigm that leads to error accumulation. To address these bottlenecks, we propose RIGA-Fold, a framework that synergizes Recurrent Interaction with Geometric Awareness. At the micro-level, we introduce a Geometric Attention Update (GAU) module where edge features explicitly serve as attention keys, ensuring strictly SE(3)-invariant local encoding. At the macro-level, we design an attention-based Global Context Bridge that acts as a soft gating mechanism to dynamically inject global topological information. Furthermore, to bridge the gap between structural and sequence modalities, we introduce an enhanced variant, RIGA-Fold*, which integrates trainable geometric features with frozen evolutionary priors from ESM-2 and ESM-IF via a dual-stream architecture. Finally, a biologically inspired ``predict-recycle-refine'' strategy is implemented to iteratively denoise sequence distributions. Extensive experiments on CATH 4.2, TS50, and TS500 benchmarks demonstrate that our geometric framework is highly competitive, while RIGA-Fold* significantly outperforms state-of-the-art baselines in both sequence recovery and structural consistency.

翻译：蛋白质逆折叠，即预测目标结构对应氨基酸序列的任务，是蛋白质从头设计的关键。然而，现有的基于图神经网络的方法通常存在感受野受限而忽略长程依赖，以及“单次”推理范式导致误差累积的问题。为解决这些瓶颈，我们提出了RIGA-Fold，一个协同融合循环交互与几何感知的框架。在微观层面，我们引入了几何注意力更新模块，其中边特征显式地作为注意力键，确保了严格的SE(3)不变局部编码。在宏观层面，我们设计了一个基于注意力的全局上下文桥接模块，作为一个软门控机制，动态注入全局拓扑信息。此外，为弥合结构与序列模态之间的鸿沟，我们引入了一个增强变体RIGA-Fold*，它通过双流架构将可训练的几何特征与来自ESM-2和ESM-IF的冻结进化先验知识相结合。最后，我们实现了一种受生物学启发的“预测-循环-精修”策略，以迭代地对序列分布进行去噪。在CATH 4.2、TS50和TS500基准测试上的大量实验表明，我们的几何框架具有高度竞争力，而RIGA-Fold*在序列恢复率和结构一致性方面均显著优于最先进的基线方法。

0

相关内容

数学上，序列是被排成一列的对象（或事件）；这样每个元素不是在其他元素之前，就是在其他元素之后。这里，元素之间的顺序非常重要。

【纽约大学博士论文】蛋白质序列和结构的预测性与生成性模型，206页pdf

【纽约大学博士论文】蛋白质序列和结构的预测性与生成性模型，206页pdf

专知会员服务

20+阅读 · 2024年4月27日

基于人工智能(AI)的蛋白结构预测工具合集

基于人工智能(AI)的蛋白结构预测工具合集

专知会员服务

10+阅读 · 2022年8月25日

【ICML2022】模型指导下的蛋白质序列设计的近端探索

【ICML2022】模型指导下的蛋白质序列设计的近端探索

专知会员服务

11+阅读 · 2022年7月10日

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

专知会员服务

11+阅读 · 2022年6月23日

AlphaFold教程与最新蛋白质结构预测进展，附视频与Slides

AlphaFold教程与最新蛋白质结构预测进展，附视频与Slides

专知会员服务

29+阅读 · 2022年6月16日

南大清华等《深度学习蛋白质设计》综述论文，涵盖16页pdf153篇文献阐述DL在蛋白质结构与序列设计的方法

南大清华等《深度学习蛋白质设计》综述论文，涵盖16页pdf153篇文献阐述DL在蛋白质结构与序列设计的方法

专知会员服务

22+阅读 · 2022年6月1日

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

专知会员服务

21+阅读 · 2022年3月14日

【中科院计算所】CopulaNet：深度学习蛋白质结构预测新进展

专知会员服务

24+阅读 · 2021年5月15日

DeepMind《AlphaFold2蛋白质结构预测》CASP14介绍报告，42页ppt

DeepMind《AlphaFold2蛋白质结构预测》CASP14介绍报告，42页ppt

专知会员服务

42+阅读 · 2021年1月15日

【论文推荐】一种用于逆合成预测的图到图框架，A Graph to Graphs Framework for Retrosynthesis Prediction

【论文推荐】一种用于逆合成预测的图到图框架，A Graph to Graphs Framework for Retrosynthesis Prediction

专知会员服务

12+阅读 · 2020年4月1日

【GNN】R-GCN：GCN 在知识图谱中的应用

【GNN】R-GCN：GCN 在知识图谱中的应用

深度学习自然语言处理

11+阅读 · 2020年5月4日

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

图与推荐

130+阅读 · 2020年2月6日

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

专知

69+阅读 · 2020年1月30日

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

科研圈

17+阅读 · 2019年10月30日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

【泡泡点云时空】FoldingNet：通过深度栅格变形的点云自编码器（CVPR2018-2）

【泡泡点云时空】FoldingNet：通过深度栅格变形的点云自编码器（CVPR2018-2）

泡泡机器人SLAM

10+阅读 · 2018年8月7日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

GAFT：一个使用 Python 实现的遗传算法框架

GAFT：一个使用 Python 实现的遗传算法框架

Python开发者

10+阅读 · 2017年8月1日

基于串联质谱数据的多肽鉴定半监督学习并行算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

RanGTPase核质运输系统通过调控AIF核转移介导细胞凋亡的分子机制

国家自然科学基金

0+阅读 · 2015年12月31日

全新骨架组蛋白甲基转移酶G9a抑制剂的构效关系、结合模式及作用机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

Ca2+依赖的蛋白酶Calpain对突触后谷氨酸受体的调控机制

国家自然科学基金

0+阅读 · 2015年12月31日

基于直链的杂交链式反应在核酸与蛋白质检测中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于分子进化的蛋白质共进化高维互信息模型

国家自然科学基金

4+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于溶液红外光谱与蛋白质组学联合技术的纳米粒子-蛋白质晕结构特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于结构与序列信息的蛋白质-配体结合位点的预测

国家自然科学基金

8+阅读 · 2015年12月31日

蛋白质结构类预测中的特征信息提取与分类算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

CMADiff: Cross-Modal Aligned Diffusion for Controllable Protein Generation

Arxiv

0+阅读 · 3月18日

Fold-CP: A Context Parallelism Framework for Biomolecular Modeling

Arxiv

0+阅读 · 3月16日

Enhanced Protein Intrinsic Disorder Prediction Through Dual-View Multiscale Features and Multi-objective Evolutionary Algorithm

Arxiv

0+阅读 · 3月6日

InstructPro: Natural Language Guided Ligand-Binding Protein Design

Arxiv

0+阅读 · 3月2日

RL-RIG: A Generative Spatial Reasoner via Intrinsic Reflection

Arxiv

0+阅读 · 2月23日

Factorization Machine with Quadratic-Optimization Annealing for RNA Inverse Folding and Evaluation of Binary-Integer Encoding and Nucleotide Assignment

Arxiv

0+阅读 · 2月18日

RIDER: 3D RNA Inverse Design with Reinforcement Learning-Guided Diffusion

Arxiv

0+阅读 · 2月18日

Geo-Code: A Code Framework for Reverse Code Generation from Geometric Images Based on Two-Stage Multi-Agent Evolution

Arxiv

0+阅读 · 2月8日

SaDiT: Efficient Protein Backbone Design via Latent Structural Tokenization and Diffusion Transformers

Arxiv

0+阅读 · 2月6日

Mechanisms of AI Protein Folding in ESMFold

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

1+阅读 · 24分钟前

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

1+阅读 · 39分钟前

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

1+阅读 · 44分钟前

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

1+阅读 · 47分钟前

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

0+阅读 · 51分钟前

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

8+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

8+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

3+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

12+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

3+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

3+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

12+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

3+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

14+阅读 · 4月18日

相关VIP内容

【纽约大学博士论文】蛋白质序列和结构的预测性与生成性模型，206页pdf

【纽约大学博士论文】蛋白质序列和结构的预测性与生成性模型，206页pdf

专知会员服务

20+阅读 · 2024年4月27日

基于人工智能(AI)的蛋白结构预测工具合集

基于人工智能(AI)的蛋白结构预测工具合集

专知会员服务

10+阅读 · 2022年8月25日

【ICML2022】模型指导下的蛋白质序列设计的近端探索

【ICML2022】模型指导下的蛋白质序列设计的近端探索

专知会员服务

11+阅读 · 2022年7月10日

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

J. Med. Chem. | RELATION: 一种基于靶标结构的深度学习全新药物设计模型

专知会员服务

11+阅读 · 2022年6月23日

AlphaFold教程与最新蛋白质结构预测进展，附视频与Slides

AlphaFold教程与最新蛋白质结构预测进展，附视频与Slides

专知会员服务

29+阅读 · 2022年6月16日

南大清华等《深度学习蛋白质设计》综述论文，涵盖16页pdf153篇文献阐述DL在蛋白质结构与序列设计的方法

南大清华等《深度学习蛋白质设计》综述论文，涵盖16页pdf153篇文献阐述DL在蛋白质结构与序列设计的方法

专知会员服务

22+阅读 · 2022年6月1日

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

【哈佛大学】使用AlphaFold估算蛋白质模型精度的最新技术，State-of-the-Art Estimation of Protein Model Accuracy using AlphaFold

专知会员服务

21+阅读 · 2022年3月14日

【中科院计算所】CopulaNet：深度学习蛋白质结构预测新进展

专知会员服务

24+阅读 · 2021年5月15日

DeepMind《AlphaFold2蛋白质结构预测》CASP14介绍报告，42页ppt

DeepMind《AlphaFold2蛋白质结构预测》CASP14介绍报告，42页ppt

专知会员服务

42+阅读 · 2021年1月15日

【论文推荐】一种用于逆合成预测的图到图框架，A Graph to Graphs Framework for Retrosynthesis Prediction

【论文推荐】一种用于逆合成预测的图到图框架，A Graph to Graphs Framework for Retrosynthesis Prediction

专知会员服务

12+阅读 · 2020年4月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《提升生成模型的安全性与保障》博士论文

军事通信系统与设备的技术演进综述

《北约标准：医疗评估手册》174页

相关资讯

【GNN】R-GCN：GCN 在知识图谱中的应用

【GNN】R-GCN：GCN 在知识图谱中的应用

深度学习自然语言处理

11+阅读 · 2020年5月4日

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

图与推荐

130+阅读 · 2020年2月6日

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

Tensorflow GNN实战：手把手教你使用tf_geometric构建图自编码器GAE（附完整代码）

专知

69+阅读 · 2020年1月30日

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

科研圈

17+阅读 · 2019年10月30日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

【泡泡点云时空】FoldingNet：通过深度栅格变形的点云自编码器（CVPR2018-2）

【泡泡点云时空】FoldingNet：通过深度栅格变形的点云自编码器（CVPR2018-2）

泡泡机器人SLAM

10+阅读 · 2018年8月7日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

GAFT：一个使用 Python 实现的遗传算法框架

GAFT：一个使用 Python 实现的遗传算法框架

Python开发者

10+阅读 · 2017年8月1日

相关论文

CMADiff: Cross-Modal Aligned Diffusion for Controllable Protein Generation

Arxiv

0+阅读 · 3月18日

Fold-CP: A Context Parallelism Framework for Biomolecular Modeling

Arxiv

0+阅读 · 3月16日

Enhanced Protein Intrinsic Disorder Prediction Through Dual-View Multiscale Features and Multi-objective Evolutionary Algorithm

Arxiv

0+阅读 · 3月6日

InstructPro: Natural Language Guided Ligand-Binding Protein Design

Arxiv

0+阅读 · 3月2日

RL-RIG: A Generative Spatial Reasoner via Intrinsic Reflection

Arxiv

0+阅读 · 2月23日

Factorization Machine with Quadratic-Optimization Annealing for RNA Inverse Folding and Evaluation of Binary-Integer Encoding and Nucleotide Assignment

Arxiv

0+阅读 · 2月18日

RIDER: 3D RNA Inverse Design with Reinforcement Learning-Guided Diffusion

Arxiv

0+阅读 · 2月18日

Geo-Code: A Code Framework for Reverse Code Generation from Geometric Images Based on Two-Stage Multi-Agent Evolution

Arxiv

0+阅读 · 2月8日

SaDiT: Efficient Protein Backbone Design via Latent Structural Tokenization and Diffusion Transformers

Arxiv

0+阅读 · 2月6日

Mechanisms of AI Protein Folding in ESMFold

Arxiv

0+阅读 · 2月5日

相关基金

基于串联质谱数据的多肽鉴定半监督学习并行算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

RanGTPase核质运输系统通过调控AIF核转移介导细胞凋亡的分子机制

国家自然科学基金

0+阅读 · 2015年12月31日

全新骨架组蛋白甲基转移酶G9a抑制剂的构效关系、结合模式及作用机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

Ca2+依赖的蛋白酶Calpain对突触后谷氨酸受体的调控机制

国家自然科学基金

0+阅读 · 2015年12月31日

基于直链的杂交链式反应在核酸与蛋白质检测中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于分子进化的蛋白质共进化高维互信息模型

国家自然科学基金

4+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于溶液红外光谱与蛋白质组学联合技术的纳米粒子-蛋白质晕结构特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于结构与序列信息的蛋白质-配体结合位点的预测

国家自然科学基金

8+阅读 · 2015年12月31日

蛋白质结构类预测中的特征信息提取与分类算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员