How do protein structure prediction models fold proteins? We investigate this question by tracing how ESMFold folds a beta hairpin, a prevalent structural motif. Through counterfactual interventions on model latents, we identify two computational stages in the folding trunk. In the first stage, early blocks initialize pairwise biochemical signals: residue identities and associated biochemical features such as charge flow from sequence representations into pairwise representations. In the second stage, late blocks develop pairwise spatial features: distance and contact information accumulate in the pairwise representation. We demonstrate that the mechanisms underlying structural decisions of ESMFold can be localized, traced through interpretable representations, and manipulated with strong causal effects.


翻译:蛋白质结构预测模型如何折叠蛋白质?我们通过追踪ESMFold折叠β发夹(一种普遍存在的结构基序)的过程来研究这一问题。通过对模型潜在空间进行反事实干预,我们在折叠主干中识别出两个计算阶段。第一阶段中,早期模块初始化成对生化信号:残基身份及其相关生化特征(如电荷)从序列表征流向成对表征。第二阶段中,晚期模块发展成对空间特征:距离与接触信息在成对表征中逐步积累。我们证明ESMFold结构决策的机制可以被定位、通过可解释表征进行追踪,并能通过强因果效应进行操控。

0
下载
关闭预览

相关内容

AlphaFold新竞争对手出现,ESMFold预测了6亿种蛋白质结构
专知会员服务
10+阅读 · 2022年11月7日
基于人工智能(AI)的蛋白结构预测工具合集
专知会员服务
10+阅读 · 2022年8月25日
AlphaFold预测出2亿种蛋白质结构,打开整个蛋白质宇宙
专知会员服务
14+阅读 · 2022年8月1日
JCIM|药物发现中基于AI的蛋白质结构预测:影响和挑战
专知会员服务
12+阅读 · 2022年6月26日
AlphaFold教程与最新蛋白质结构预测进展,附视频与Slides
专知会员服务
29+阅读 · 2022年6月16日
DeepMind《AlphaFold2蛋白质结构预测》CASP14介绍报告,42页ppt
8篇论文梳理BERT相关模型进展与反思 | MSRA出品
量子位
11+阅读 · 2019年9月15日
【泡泡图灵智库】HSfM: 混合运动恢复结构(CVPR)
泡泡机器人SLAM
11+阅读 · 2018年12月13日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员