Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics - 专知论文

会员服务 ·

0

长时程 · 蛋白质动力学 · 时间尺度 · 分子 · 生物 ·

Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics

翻译：可扩展的时空SE(3)扩散模型用于长时程蛋白质动力学预测

Nima Shoghi,Yuxuan Liu,Yuning Shen,Rob Brekelmans,Pan Li,Quanquan Gu

from arxiv, 49 pages, 28 figures. Accepted by ICLR 2026. Project page: https://bytedance-seed.github.io/ConfRover/starmd

Molecular dynamics (MD) simulations remain the gold standard for studying protein dynamics, but their computational cost limits access to biologically relevant timescales. Recent generative models have shown promise in accelerating simulations, yet they struggle with long-horizon generation due to architectural constraints, error accumulation, and inadequate modeling of spatio-temporal dynamics. We present STAR-MD (Spatio-Temporal Autoregressive Rollout for Molecular Dynamics), a scalable SE(3)-equivariant diffusion model that generates physically plausible protein trajectories over microsecond timescales. Our key innovation is a causal diffusion transformer with joint spatio-temporal attention that efficiently captures complex space-time dependencies while avoiding the memory bottlenecks of existing methods. On the standard ATLAS benchmark, STAR-MD achieves state-of-the-art performance across all metrics--substantially improving conformational coverage, structural validity, and dynamic fidelity compared to previous methods. STAR-MD successfully extrapolates to generate stable microsecond-scale trajectories where baseline methods fail catastrophically, maintaining high structural quality throughout the extended rollout. Our comprehensive evaluation reveals severe limitations in current models for long-horizon generation, while demonstrating that STAR-MD's joint spatio-temporal modeling enables robust dynamics simulation at biologically relevant timescales, paving the way for accelerated exploration of protein function.

翻译：分子动力学（MD）模拟仍是研究蛋白质动力学的金标准，但其计算成本限制了其在生物学相关时间尺度上的应用。近期生成模型在加速模拟方面展现出潜力，但由于架构限制、误差累积以及时空动力学建模不足，它们在长时程生成方面仍面临困难。我们提出了STAR-MD（面向分子动力学的时空自回归推演模型），这是一种可扩展的SE(3)等变扩散模型，能够在微秒时间尺度上生成物理合理的蛋白质轨迹。我们的核心创新在于采用具有联合时空注意力机制的因果扩散Transformer，该架构能有效捕捉复杂的时空依赖关系，同时避免现有方法的内存瓶颈问题。在标准ATLAS基准测试中，STAR-MD在所有指标上均达到最先进性能——相较于先前方法，在构象覆盖度、结构有效性和动态保真度方面均有显著提升。STAR-MD成功实现了稳定微秒尺度轨迹的外推生成，而基线方法在此任务中完全失效，且该模型在扩展推演过程中始终保持高质量结构特性。我们的综合评估揭示了当前模型在长时程生成方面的严重局限性，同时证明STAR-MD的联合时空建模能够实现生物学相关时间尺度上的稳健动力学模拟，为加速探索蛋白质功能开辟了新途径。

0

相关内容

长时程

用于时间序列预测的扩散模型：综述

用于时间序列预测的扩散模型：综述

专知会员服务

30+阅读 · 2025年7月22日

【HKUST博士论文】迈向可扩展且具泛化能力的时空预测

【HKUST博士论文】迈向可扩展且具泛化能力的时空预测

专知会员服务

18+阅读 · 2025年6月27日

高效扩散模型综述

高效扩散模型综述

专知会员服务

34+阅读 · 2025年2月1日

【NeurIPS2024】用于时间序列预测的检索增强扩散模型

【NeurIPS2024】用于时间序列预测的检索增强扩散模型

专知会员服务

24+阅读 · 2024年10月25日

【NeurIPS2024】分子动力学轨迹的生成建模

【NeurIPS2024】分子动力学轨迹的生成建模

专知会员服务

12+阅读 · 2024年9月28日

多模态可控扩散模型综述

多模态可控扩散模型综述

专知会员服务

39+阅读 · 2024年7月20日

时间序列和时空数据扩散模型综述

时间序列和时空数据扩散模型综述

专知会员服务

64+阅读 · 2024年5月1日

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

专知会员服务

15+阅读 · 2022年6月4日

【Nature通讯】结合深度学习和分子动力学模拟探索蛋白质的长程相互作用模式和酶活性

【Nature通讯】结合深度学习和分子动力学模拟探索蛋白质的长程相互作用模式和酶活性

专知会员服务

19+阅读 · 2022年4月7日

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

专知会员服务

17+阅读 · 2022年3月6日

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【论文笔记】用于深度时空图建模的Geaph WaveNet

【论文笔记】用于深度时空图建模的Geaph WaveNet

专知

109+阅读 · 2019年11月4日

从动力学角度看优化算法：GAN的第三个阶段

从动力学角度看优化算法：GAN的第三个阶段

PaperWeekly

11+阅读 · 2019年5月13日

利用动态深度学习预测金融时间序列基于Python

利用动态深度学习预测金融时间序列基于Python

量化投资与机器学习

18+阅读 · 2018年10月30日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

香港中大-商汤科技联合实验室AAAI录用论文详解：ST-GCN时空图卷积网络模型

香港中大-商汤科技联合实验室AAAI录用论文详解：ST-GCN时空图卷积网络模型

商汤科技

12+阅读 · 2018年2月11日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

一些流体力学方程的长时间动力学行为

国家自然科学基金

0+阅读 · 2017年12月31日

可扩展的蛋白质组学大数据存储与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于结构与序列信息的蛋白质-配体结合位点的预测

国家自然科学基金

8+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于2-D空间离散数据的质量与产出的预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

对具有非平衡多标签特性的蛋白质功能类型分类预测研究

国家自然科学基金

0+阅读 · 2014年12月31日

超线性增长条件下的混杂型随机时滞微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

Learning the action for long-time-step simulations of molecular dynamics

Arxiv

0+阅读 · 3月6日

Characterizing Machine Learning Force Fields as Emerging Molecular Dynamics Workloads on Graphics Processing Units

Arxiv

0+阅读 · 3月4日

Unified Biomolecular Trajectory Generation via Pretrained Variational Bridge

Arxiv

0+阅读 · 2月27日

Assessment of Spatio-Temporal Predictors in the Presence of Missing and Heterogeneous Data

Arxiv

0+阅读 · 2月27日

Fully Convolutional Spatiotemporal Learning for Microstructure Evolution Prediction

Arxiv

0+阅读 · 2月23日

Stable Long-Horizon Spatiotemporal Prediction on Meshes Using Latent Multiscale Recurrent Graph Neural Networks

Arxiv

0+阅读 · 2月20日

Enhanced Diffusion Sampling: Efficient Rare Event Sampling and Free Energy Calculation with Diffusion Models

Arxiv

0+阅读 · 2月18日

SaDiT: Efficient Protein Backbone Design via Latent Structural Tokenization and Diffusion Transformers

Arxiv

0+阅读 · 2月6日

MDAgent2: Large Language Model for Code Generation and Knowledge Q&A in Molecular Dynamics

Arxiv

0+阅读 · 2月6日

Sequence Diffusion Model for Temporal Link Prediction in Continuous-Time Dynamic Graph

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

蛋白质动力学

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

6+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

7+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

5+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

4+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

8+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

8+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

4+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

4+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

8+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

7+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

12+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

6+阅读 · 4月20日

相关VIP内容

用于时间序列预测的扩散模型：综述

用于时间序列预测的扩散模型：综述

专知会员服务

30+阅读 · 2025年7月22日

【HKUST博士论文】迈向可扩展且具泛化能力的时空预测

【HKUST博士论文】迈向可扩展且具泛化能力的时空预测

专知会员服务

18+阅读 · 2025年6月27日

高效扩散模型综述

高效扩散模型综述

专知会员服务

34+阅读 · 2025年2月1日

【NeurIPS2024】用于时间序列预测的检索增强扩散模型

【NeurIPS2024】用于时间序列预测的检索增强扩散模型

专知会员服务

24+阅读 · 2024年10月25日

【NeurIPS2024】分子动力学轨迹的生成建模

【NeurIPS2024】分子动力学轨迹的生成建模

专知会员服务

12+阅读 · 2024年9月28日

多模态可控扩散模型综述

多模态可控扩散模型综述

专知会员服务

39+阅读 · 2024年7月20日

时间序列和时空数据扩散模型综述

时间序列和时空数据扩散模型综述

专知会员服务

64+阅读 · 2024年5月1日

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

【ICML2022】蛋白质适应度预测与自回归transformers和推理时间检索

专知会员服务

15+阅读 · 2022年6月4日

【Nature通讯】结合深度学习和分子动力学模拟探索蛋白质的长程相互作用模式和酶活性

【Nature通讯】结合深度学习和分子动力学模拟探索蛋白质的长程相互作用模式和酶活性

专知会员服务

19+阅读 · 2022年4月7日

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

【伯克利Roshan Rao博士论文】训练，评估和理解蛋白质序列的进化模型，Training, Evaluating, and Understanding Evolutionary Models for Protein Sequences

专知会员服务

17+阅读 · 2022年3月6日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

时空序列预测方法综述

时空序列预测方法综述

专知

22+阅读 · 2020年10月19日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【论文笔记】用于深度时空图建模的Geaph WaveNet

【论文笔记】用于深度时空图建模的Geaph WaveNet

专知

109+阅读 · 2019年11月4日

从动力学角度看优化算法：GAN的第三个阶段

从动力学角度看优化算法：GAN的第三个阶段

PaperWeekly

11+阅读 · 2019年5月13日

利用动态深度学习预测金融时间序列基于Python

利用动态深度学习预测金融时间序列基于Python

量化投资与机器学习

18+阅读 · 2018年10月30日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

香港中大-商汤科技联合实验室AAAI录用论文详解：ST-GCN时空图卷积网络模型

香港中大-商汤科技联合实验室AAAI录用论文详解：ST-GCN时空图卷积网络模型

商汤科技

12+阅读 · 2018年2月11日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Learning the action for long-time-step simulations of molecular dynamics

Arxiv

0+阅读 · 3月6日

Characterizing Machine Learning Force Fields as Emerging Molecular Dynamics Workloads on Graphics Processing Units

Arxiv

0+阅读 · 3月4日

Unified Biomolecular Trajectory Generation via Pretrained Variational Bridge

Arxiv

0+阅读 · 2月27日

Assessment of Spatio-Temporal Predictors in the Presence of Missing and Heterogeneous Data

Arxiv

0+阅读 · 2月27日

Fully Convolutional Spatiotemporal Learning for Microstructure Evolution Prediction

Arxiv

0+阅读 · 2月23日

Stable Long-Horizon Spatiotemporal Prediction on Meshes Using Latent Multiscale Recurrent Graph Neural Networks

Arxiv

0+阅读 · 2月20日

Enhanced Diffusion Sampling: Efficient Rare Event Sampling and Free Energy Calculation with Diffusion Models

Arxiv

0+阅读 · 2月18日

SaDiT: Efficient Protein Backbone Design via Latent Structural Tokenization and Diffusion Transformers

Arxiv

0+阅读 · 2月6日

MDAgent2: Large Language Model for Code Generation and Knowledge Q&A in Molecular Dynamics

Arxiv

0+阅读 · 2月6日

Sequence Diffusion Model for Temporal Link Prediction in Continuous-Time Dynamic Graph

Arxiv

0+阅读 · 1月30日

相关基金

一些流体力学方程的长时间动力学行为

国家自然科学基金

0+阅读 · 2017年12月31日

可扩展的蛋白质组学大数据存储与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于结构与序列信息的蛋白质-配体结合位点的预测

国家自然科学基金

8+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于2-D空间离散数据的质量与产出的预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

对具有非平衡多标签特性的蛋白质功能类型分类预测研究

国家自然科学基金

0+阅读 · 2014年12月31日

超线性增长条件下的混杂型随机时滞微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员