PiFold: Toward effective and efficient protein inverse folding - 专知论文

会员服务 ·

0

蛋白质序列 · 序列 · 高准确性 · 设计 · 残基 ·

2023 年 4 月 13 日

PiFold: Toward effective and efficient protein inverse folding

翻译：PiFold：面向高效能蛋白质逆折叠的方法

Zhangyang Gao,Cheng Tan,Pablo Chacón,Stan Z. Li

How can we design protein sequences folding into the desired structures effectively and efficiently? AI methods for structure-based protein design have attracted increasing attention in recent years; however, few methods can simultaneously improve the accuracy and efficiency due to the lack of expressive features and autoregressive sequence decoder. To address these issues, we propose PiFold, which contains a novel residue featurizer and PiGNN layers to generate protein sequences in a one-shot way with improved recovery. Experiments show that PiFold could achieve 51.66\% recovery on CATH 4.2, while the inference speed is 70 times faster than the autoregressive competitors. In addition, PiFold achieves 58.72\% and 60.42\% recovery scores on TS50 and TS500, respectively. We conduct comprehensive ablation studies to reveal the role of different types of protein features and model designs, inspiring further simplification and improvement. The PyTorch code is available at \href{https://github.com/A4Bio/PiFold}{GitHub}.

翻译：我们如何有效且高效地设计出能够折叠成目标结构的蛋白质序列？近年来，基于结构的蛋白质设计人工智能方法日益受到关注；然而，由于缺乏高表达性的特征以及自回归序列解码器，极少有方法能同时提升准确率与效率。针对这些问题，我们提出PiFold模型，该模型包含新型残基特征化模块与PiGNN网络层，能够以一次性生成方式产出蛋白质序列，并显著提高恢复率。实验表明，在CATH 4.2数据集上，PiFold的恢复率达到51.66%，且推理速度比自回归类方法快70倍。此外，在TS50与TS500数据集上，PiFold分别取得58.72%和60.42%的恢复率。我们通过全面的消融实验揭示了不同类型蛋白质特征与模型设计的关键作用，为后续的简化与改进提供了启发。PyTorch代码已在GitHub上开源（\href{https://github.com/A4Bio/PiFold}{GitHub}）。

0

相关内容

蛋白质序列

蛋白质序列

Science | ProteinMPNN : 基于深度学习的蛋白序列设计

Science | ProteinMPNN : 基于深度学习的蛋白序列设计

专知会员服务

12+阅读 · 2022年9月18日

高精度从头设计透膜环肽分子

高精度从头设计透膜环肽分子

专知会员服务

3+阅读 · 2022年9月6日

Nat Methods｜ColabFold：让所有人都能进行蛋白质折叠

Nat Methods｜ColabFold：让所有人都能进行蛋白质折叠

专知会员服务

7+阅读 · 2022年6月27日

【2022新书】高效深度学习，Efficient Deep Learning Book

【2022新书】高效深度学习，Efficient Deep Learning Book

专知会员服务

128+阅读 · 2022年4月21日

【ACL2022】一种基于三阶张量同构的高效实体对齐译码算法, An Effective and Efficient Entity Alignment Decoding Algorithm via Third-Order Tensor Isomorphism

【ACL2022】一种基于三阶张量同构的高效实体对齐译码算法, An Effective and Efficient Entity Alignment Decoding Algorithm via Third-Order Tensor Isomorphism

专知会员服务

13+阅读 · 2022年3月24日

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

专知会员服务

78+阅读 · 2022年3月15日

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

专知会员服务

18+阅读 · 2022年3月15日

哥伦比亚大学最新《机器学习》课程，Fall-B 2020 (Machine Learning)

专知会员服务

39+阅读 · 2020年11月3日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

已删除

将门创投

11+阅读 · 2019年4月26日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Hierarchical Imitation - Reinforcement Learning

Hierarchical Imitation - Reinforcement Learning

CreateAMind

19+阅读 · 2018年5月25日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新5篇度量学习（Metric Learning）相关论文—人脸验证、BIER、自适应图卷积、注意力机制、单次学习

【论文推荐】最新5篇度量学习（Metric Learning）相关论文—人脸验证、BIER、自适应图卷积、注意力机制、单次学习

专知

17+阅读 · 2018年2月11日

【推荐】RNN最新研究进展综述

【推荐】RNN最新研究进展综述

机器学习研究会

26+阅读 · 2018年1月6日

【推荐】用Tensorflow理解LSTM

【推荐】用Tensorflow理解LSTM

机器学习研究会

36+阅读 · 2017年9月11日

【推荐】RNN/LSTM时序预测

【推荐】RNN/LSTM时序预测

机器学习研究会

25+阅读 · 2017年9月8日

具有π共轭平面结构单元的新型红外非线性光学材料的设计、合成、晶体生长和性能研究

国家自然科学基金

0+阅读 · 2016年12月31日

GSNOR介导蛋白质亚硝基化调控番茄耐碱性机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光致电荷转移的蛋白质荧光传感器

国家自然科学基金

0+阅读 · 2014年12月31日

全共轭聚合物共混体系相分离与光伏性质

国家自然科学基金

0+阅读 · 2013年12月31日

基于双层复合光阳极的高效染料敏化太阳能电池研究

国家自然科学基金

0+阅读 · 2012年12月31日

分子内与分子间CT过程协同增强光电转换效率的理论与实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

磷酸化对聚腺苷酸专一性核糖核酸酶结构和功能的调控

国家自然科学基金

0+阅读 · 2012年12月31日

从头设计蛋白质DS119折叠机制的分子模拟研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于Smiles重排串联反应的并三环杂环体系的构建

国家自然科学基金

0+阅读 · 2011年12月31日

以热休克蛋白90为靶标的抗癌化合物的设计、合成和活性评价

国家自然科学基金

1+阅读 · 2009年12月31日

Computationally Efficient 3D MRI Reconstruction with Adaptive MLP

Arxiv

0+阅读 · 2023年5月31日

Consistency Models

Arxiv

0+阅读 · 2023年5月31日

Efficient Training of Energy-Based Models Using Jarzynski Equality

Arxiv

0+阅读 · 2023年5月30日

Trade-off Between Efficiency and Consistency for Removal-based Explanations

Arxiv

0+阅读 · 2023年5月30日

Query-Efficient Black-Box Red Teaming via Bayesian Optimization

Arxiv

0+阅读 · 2023年5月27日

NeuManifold: Neural Watertight Manifold Reconstruction with Efficient and High-Quality Rendering Support

Arxiv

0+阅读 · 2023年5月26日

PAD-Net: An Efficient Framework for Dynamic Networks

Arxiv

0+阅读 · 2023年5月26日

Automatic Tuning of Loss Trade-offs without Hyper-parameter Search in End-to-End Zero-Shot Speech Synthesis

Arxiv

0+阅读 · 2023年5月26日

Survey on Evolutionary Deep Learning: Principles, Algorithms, Applications and Open Issues

Arxiv

20+阅读 · 2022年8月23日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

VIP会员

文章信息

相关主题

蛋白质序列

最新内容

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

7+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

5+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

6+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

4+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

8+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

7+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

4+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

2+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

5+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

3+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

4+阅读 · 7月17日

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

12+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

14+阅读 · 7月16日

相关VIP内容

Science | ProteinMPNN : 基于深度学习的蛋白序列设计

Science | ProteinMPNN : 基于深度学习的蛋白序列设计

专知会员服务

12+阅读 · 2022年9月18日

高精度从头设计透膜环肽分子

高精度从头设计透膜环肽分子

专知会员服务

3+阅读 · 2022年9月6日

Nat Methods｜ColabFold：让所有人都能进行蛋白质折叠

Nat Methods｜ColabFold：让所有人都能进行蛋白质折叠

专知会员服务

7+阅读 · 2022年6月27日

【2022新书】高效深度学习，Efficient Deep Learning Book

【2022新书】高效深度学习，Efficient Deep Learning Book

专知会员服务

128+阅读 · 2022年4月21日

【ACL2022】一种基于三阶张量同构的高效实体对齐译码算法, An Effective and Efficient Entity Alignment Decoding Algorithm via Third-Order Tensor Isomorphism

【ACL2022】一种基于三阶张量同构的高效实体对齐译码算法, An Effective and Efficient Entity Alignment Decoding Algorithm via Third-Order Tensor Isomorphism

专知会员服务

13+阅读 · 2022年3月24日

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

专知会员服务

78+阅读 · 2022年3月15日

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

【斯坦福CVPR2022】EG3D:高效的几何感知三维生成对抗网络，EG3D: Efficient Geometry-aware 3D Generative Adversarial Networks

专知会员服务

18+阅读 · 2022年3月15日

哥伦比亚大学最新《机器学习》课程，Fall-B 2020 (Machine Learning)

专知会员服务

39+阅读 · 2020年11月3日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

50+阅读 · 2019年10月17日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

相关资讯

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

已删除

将门创投

11+阅读 · 2019年4月26日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Hierarchical Imitation - Reinforcement Learning

Hierarchical Imitation - Reinforcement Learning

CreateAMind

19+阅读 · 2018年5月25日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新5篇度量学习（Metric Learning）相关论文—人脸验证、BIER、自适应图卷积、注意力机制、单次学习

【论文推荐】最新5篇度量学习（Metric Learning）相关论文—人脸验证、BIER、自适应图卷积、注意力机制、单次学习

专知

17+阅读 · 2018年2月11日

【推荐】RNN最新研究进展综述

【推荐】RNN最新研究进展综述

机器学习研究会

26+阅读 · 2018年1月6日

【推荐】用Tensorflow理解LSTM

【推荐】用Tensorflow理解LSTM

机器学习研究会

36+阅读 · 2017年9月11日

【推荐】RNN/LSTM时序预测

【推荐】RNN/LSTM时序预测

机器学习研究会

25+阅读 · 2017年9月8日

相关论文

Computationally Efficient 3D MRI Reconstruction with Adaptive MLP

Arxiv

0+阅读 · 2023年5月31日

Consistency Models

Arxiv

0+阅读 · 2023年5月31日

Efficient Training of Energy-Based Models Using Jarzynski Equality

Arxiv

0+阅读 · 2023年5月30日

Trade-off Between Efficiency and Consistency for Removal-based Explanations

Arxiv

0+阅读 · 2023年5月30日

Query-Efficient Black-Box Red Teaming via Bayesian Optimization

Arxiv

0+阅读 · 2023年5月27日

NeuManifold: Neural Watertight Manifold Reconstruction with Efficient and High-Quality Rendering Support

Arxiv

0+阅读 · 2023年5月26日

PAD-Net: An Efficient Framework for Dynamic Networks

Arxiv

0+阅读 · 2023年5月26日

Automatic Tuning of Loss Trade-offs without Hyper-parameter Search in End-to-End Zero-Shot Speech Synthesis

Arxiv

0+阅读 · 2023年5月26日

Survey on Evolutionary Deep Learning: Principles, Algorithms, Applications and Open Issues

Arxiv

20+阅读 · 2022年8月23日

Differentiable Dynamic Programming for Structured Prediction and Attention

Arxiv

56+阅读 · 2018年2月20日

相关基金

具有π共轭平面结构单元的新型红外非线性光学材料的设计、合成、晶体生长和性能研究

国家自然科学基金

0+阅读 · 2016年12月31日

GSNOR介导蛋白质亚硝基化调控番茄耐碱性机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光致电荷转移的蛋白质荧光传感器

国家自然科学基金

0+阅读 · 2014年12月31日

全共轭聚合物共混体系相分离与光伏性质

国家自然科学基金

0+阅读 · 2013年12月31日

基于双层复合光阳极的高效染料敏化太阳能电池研究

国家自然科学基金

0+阅读 · 2012年12月31日

分子内与分子间CT过程协同增强光电转换效率的理论与实验研究

国家自然科学基金

0+阅读 · 2012年12月31日

磷酸化对聚腺苷酸专一性核糖核酸酶结构和功能的调控

国家自然科学基金

0+阅读 · 2012年12月31日

从头设计蛋白质DS119折叠机制的分子模拟研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于Smiles重排串联反应的并三环杂环体系的构建

国家自然科学基金

0+阅读 · 2011年12月31日

以热休克蛋白90为靶标的抗癌化合物的设计、合成和活性评价

国家自然科学基金

1+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员