DDP-WM: Disentangled Dynamics Prediction for Efficient World Models - 专知论文

会员服务 ·

0

动态预测 · 世界模型 · 解耦 · 分解 · 交互 ·

DDP-WM: Disentangled Dynamics Prediction for Efficient World Models

翻译：DDP-WM：基于解耦动态预测的高效世界模型

Shicheng Yin,Kaixuan Yin,Weixing Chen,Yang Liu,Guanbin Li,Liang Lin

from arxiv, Codes will be available at https://github.com/HCPLabSYSU/DDP-WM

World models are essential for autonomous robotic planning. However, the substantial computational overhead of existing dense Transformerbased models significantly hinders real-time deployment. To address this efficiency-performance bottleneck, we introduce DDP-WM, a novel world model centered on the principle of Disentangled Dynamics Prediction (DDP). We hypothesize that latent state evolution in observed scenes is heterogeneous and can be decomposed into sparse primary dynamics driven by physical interactions and secondary context-driven background updates. DDP-WM realizes this decomposition through an architecture that integrates efficient historical processing with dynamic localization to isolate primary dynamics. By employing a crossattention mechanism for background updates, the framework optimizes resource allocation and provides a smooth optimization landscape for planners. Extensive experiments demonstrate that DDP-WM achieves significant efficiency and performance across diverse tasks, including navigation, precise tabletop manipulation, and complex deformable or multi-body interactions. Specifically, on the challenging Push-T task, DDP-WM achieves an approximately 9 times inference speedup and improves the MPC success rate from 90% to98% compared to state-of-the-art dense models. The results establish a promising path for developing efficient, high-fidelity world models. Codes will be available at https://github.com/HCPLabSYSU/DDP-WM.

翻译：世界模型对于自主机器人规划至关重要。然而，现有基于密集Transformer的模型存在巨大的计算开销，严重阻碍了实时部署。为解决这一效率与性能瓶颈，我们提出了DDP-WM，这是一种以解耦动态预测（DDP）原理为核心的新型世界模型。我们假设观测场景中的潜在状态演化是异质的，可以分解为由物理交互驱动的稀疏主要动态和由上下文驱动的次要背景更新。DDP-WM通过一种将高效历史处理与动态定位相结合的架构来实现这种分解，从而隔离主要动态。该框架通过采用交叉注意力机制进行背景更新，优化了资源分配，并为规划器提供了平滑的优化空间。大量实验表明，DDP-WM在多种任务中实现了显著的效率和性能提升，包括导航、精确桌面操作以及复杂的可变形或多体交互。具体而言，在具有挑战性的Push-T任务上，与最先进的密集模型相比，DDP-WM实现了约9倍的推理加速，并将MPC成功率从90%提升至98%。这些结果为开发高效、高保真的世界模型指明了一条前景广阔的路径。代码将在 https://github.com/HCPLabSYSU/DDP-WM 发布。

0

相关内容

动态预测

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

专知会员服务

33+阅读 · 2025年10月9日

【ICML2025】FOUNDER：将基础模型嵌入世界模型以实现开放式具身决策

【ICML2025】FOUNDER：将基础模型嵌入世界模型以实现开放式具身决策

专知会员服务

13+阅读 · 2025年7月19日

【MIT博士论文】通过神经物理构建世界模型

【MIT博士论文】通过神经物理构建世界模型

专知会员服务

36+阅读 · 2025年4月3日

面向战场移动威胁的预测模型：利用预测性数据模型打击大规模移动目标

面向战场移动威胁的预测模型：利用预测性数据模型打击大规模移动目标

专知会员服务

43+阅读 · 2024年12月23日

理解世界还是预测未来？世界模型的综合综述

理解世界还是预测未来？世界模型的综合综述

专知会员服务

78+阅读 · 2024年11月26日

非Transformer不可？最新《状态空间模型（SSM）》综述

非Transformer不可？最新《状态空间模型（SSM）》综述

专知会员服务

75+阅读 · 2024年4月16日

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

专知会员服务

76+阅读 · 2023年11月27日

深度预测学习：模型与应用

深度预测学习：模型与应用

专知会员服务

49+阅读 · 2022年12月5日

牛津大学发布首篇《Transformer多模态学习》综述论文，23页pdf涵盖310篇文献全面阐述MMT的理论与应用

牛津大学发布首篇《Transformer多模态学习》综述论文，23页pdf涵盖310篇文献全面阐述MMT的理论与应用

专知会员服务

124+阅读 · 2022年6月15日

国内数十位NLP大佬合作，综述预训练模型的过去、现在与未来

国内数十位NLP大佬合作，综述预训练模型的过去、现在与未来

专知会员服务

33+阅读 · 2021年9月8日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

专知

40+阅读 · 2019年9月27日

阿里深度序列匹配模型SDM：如何刻画大型推荐系统的用户行为？

阿里深度序列匹配模型SDM：如何刻画大型推荐系统的用户行为？

AI100

21+阅读 · 2019年9月10日

谷歌NIPS论文Transformer模型解读：只要Attention就够了

谷歌NIPS论文Transformer模型解读：只要Attention就够了

AI100

14+阅读 · 2019年9月9日

【论文推荐】最新六篇主题模型相关论文—动态主题模型、主题趋势、大规模并行采样、随机采样、非参主题建模

【论文推荐】最新六篇主题模型相关论文—动态主题模型、主题趋势、大规模并行采样、随机采样、非参主题建模

专知

14+阅读 · 2018年6月24日

概率图模型体系：HMM、MEMM、CRF

概率图模型体系：HMM、MEMM、CRF

机器学习研究会

30+阅读 · 2018年2月10日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

基于子模优化的远程预警传感器管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于连续时间PWA模型的混杂系统预测控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于矩量法与渐近波形估计技术的动态海面宽带电磁散射特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于经验模式分解和跳步-广义回归神经网络的地球定向参数预报

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于Phase-type分布的多状态系统可靠性模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑分布式电源和多样性负荷主动特性的复杂配电系统动态随机规划模型与方法

国家自然科学基金

0+阅读 · 2014年12月31日

千万自由度量级并行有限元模态和振动分析软件研发

国家自然科学基金

0+阅读 · 2014年12月31日

高、低压电网动态行为耦合特征及解耦处理方法

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

H-WM: Robotic Task and Motion Planning Guided by Hierarchical World Model

Arxiv

0+阅读 · 3月4日

Chain of World: World Model Thinking in Latent Motion

Arxiv

0+阅读 · 3月3日

AdaWorldPolicy: World-Model-Driven Diffusion Policy with Online Adaptive Learning for Robotic Manipulation

Arxiv

0+阅读 · 2月23日

VLM-DEWM: Dynamic External World Model for Verifiable and Resilient Vision-Language Planning in Manufacturing

Arxiv

0+阅读 · 2月17日

H-WM: Robotic Task and Motion Planning Guided by Hierarchical World Model

Arxiv

0+阅读 · 2月11日

ContactGaussian-WM: Learning Physics-Grounded World Model from Videos

Arxiv

0+阅读 · 2月11日

MoWM: Mixture-of-World-Models for Embodied Planning via Latent-to-Pixel Feature Modulation

Arxiv

0+阅读 · 2月10日

ProOPF: Benchmarking and Improving LLMs for Professional-Grade Power Systems Optimization Modeling

Arxiv

0+阅读 · 2月6日

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Arxiv

0+阅读 · 2月6日

Coupled Local and Global World Models for Efficient First Order RL

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

3+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

2+阅读 · 6月24日

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

8+阅读 · 6月24日

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

6+阅读 · 6月24日

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

5+阅读 · 6月24日

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

5+阅读 · 6月24日

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

6+阅读 · 6月24日

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

5+阅读 · 6月24日

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

7+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

6+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

9+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

8+阅读 · 6月23日

相关VIP内容

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

专知会员服务

33+阅读 · 2025年10月9日

【ICML2025】FOUNDER：将基础模型嵌入世界模型以实现开放式具身决策

【ICML2025】FOUNDER：将基础模型嵌入世界模型以实现开放式具身决策

专知会员服务

13+阅读 · 2025年7月19日

【MIT博士论文】通过神经物理构建世界模型

【MIT博士论文】通过神经物理构建世界模型

专知会员服务

36+阅读 · 2025年4月3日

面向战场移动威胁的预测模型：利用预测性数据模型打击大规模移动目标

面向战场移动威胁的预测模型：利用预测性数据模型打击大规模移动目标

专知会员服务

43+阅读 · 2024年12月23日

理解世界还是预测未来？世界模型的综合综述

理解世界还是预测未来？世界模型的综合综述

专知会员服务

78+阅读 · 2024年11月26日

非Transformer不可？最新《状态空间模型（SSM）》综述

非Transformer不可？最新《状态空间模型（SSM）》综述

专知会员服务

75+阅读 · 2024年4月16日

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

专知会员服务

76+阅读 · 2023年11月27日

深度预测学习：模型与应用

深度预测学习：模型与应用

专知会员服务

49+阅读 · 2022年12月5日

牛津大学发布首篇《Transformer多模态学习》综述论文，23页pdf涵盖310篇文献全面阐述MMT的理论与应用

牛津大学发布首篇《Transformer多模态学习》综述论文，23页pdf涵盖310篇文献全面阐述MMT的理论与应用

专知会员服务

124+阅读 · 2022年6月15日

国内数十位NLP大佬合作，综述预训练模型的过去、现在与未来

国内数十位NLP大佬合作，综述预训练模型的过去、现在与未来

专知会员服务

33+阅读 · 2021年9月8日

热门VIP内容

开通专知VIP会员享更多权益服务

Agentic RL：框架、实践与长程智能体训练

重新思考无人机时代的生存能力

综述 | 从问答到任务完成：Agent系统与Harness设计

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

相关资讯

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

专知

40+阅读 · 2019年9月27日

阿里深度序列匹配模型SDM：如何刻画大型推荐系统的用户行为？

阿里深度序列匹配模型SDM：如何刻画大型推荐系统的用户行为？

AI100

21+阅读 · 2019年9月10日

谷歌NIPS论文Transformer模型解读：只要Attention就够了

谷歌NIPS论文Transformer模型解读：只要Attention就够了

AI100

14+阅读 · 2019年9月9日

【论文推荐】最新六篇主题模型相关论文—动态主题模型、主题趋势、大规模并行采样、随机采样、非参主题建模

【论文推荐】最新六篇主题模型相关论文—动态主题模型、主题趋势、大规模并行采样、随机采样、非参主题建模

专知

14+阅读 · 2018年6月24日

概率图模型体系：HMM、MEMM、CRF

概率图模型体系：HMM、MEMM、CRF

机器学习研究会

30+阅读 · 2018年2月10日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

相关论文

H-WM: Robotic Task and Motion Planning Guided by Hierarchical World Model

Arxiv

0+阅读 · 3月4日

Chain of World: World Model Thinking in Latent Motion

Arxiv

0+阅读 · 3月3日

AdaWorldPolicy: World-Model-Driven Diffusion Policy with Online Adaptive Learning for Robotic Manipulation

Arxiv

0+阅读 · 2月23日

VLM-DEWM: Dynamic External World Model for Verifiable and Resilient Vision-Language Planning in Manufacturing

Arxiv

0+阅读 · 2月17日

H-WM: Robotic Task and Motion Planning Guided by Hierarchical World Model

Arxiv

0+阅读 · 2月11日

ContactGaussian-WM: Learning Physics-Grounded World Model from Videos

Arxiv

0+阅读 · 2月11日

MoWM: Mixture-of-World-Models for Embodied Planning via Latent-to-Pixel Feature Modulation

Arxiv

0+阅读 · 2月10日

ProOPF: Benchmarking and Improving LLMs for Professional-Grade Power Systems Optimization Modeling

Arxiv

0+阅读 · 2月6日

World-VLA-Loop: Closed-Loop Learning of Video World Model and VLA Policy

Arxiv

0+阅读 · 2月6日

Coupled Local and Global World Models for Efficient First Order RL

Arxiv

0+阅读 · 2月5日

相关基金

基于子模优化的远程预警传感器管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于连续时间PWA模型的混杂系统预测控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于矩量法与渐近波形估计技术的动态海面宽带电磁散射特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于经验模式分解和跳步-广义回归神经网络的地球定向参数预报

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于Phase-type分布的多状态系统可靠性模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑分布式电源和多样性负荷主动特性的复杂配电系统动态随机规划模型与方法

国家自然科学基金

0+阅读 · 2014年12月31日

千万自由度量级并行有限元模态和振动分析软件研发

国家自然科学基金

0+阅读 · 2014年12月31日

高、低压电网动态行为耦合特征及解耦处理方法

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员