组合扩散引导搜索在长时域规划中的应用 (Compositional Diffusion with Guided Search for Long-Horizon Planning) - 专知论文

会员服务 ·

0

时域 · 搜索 · 生成模型 · 操作 · 全景图像 ·

Compositional Diffusion with Guided Search for Long-Horizon Planning

翻译：组合扩散引导搜索在长时域规划中的应用

Utkarsh A Mishra,David He,Yongxin Chen,Danfei Xu

from arxiv, 38 pages, 18 figures

Generative models have emerged as powerful tools for planning, with compositional approaches offering particular promise for modeling long-horizon task distributions by composing together local, modular generative models. This compositional paradigm spans diverse domains, from multi-step manipulation planning to panoramic image synthesis to long video generation. However, compositional generative models face a critical challenge: when local distributions are multimodal, existing composition methods average incompatible modes, producing plans that are neither locally feasible nor globally coherent. We propose Compositional Diffusion with Guided Search (CDGS), which addresses this mode averaging problem by embedding search directly within the diffusion denoising process. Our method explores diverse combinations of local modes through population-based sampling, prunes infeasible candidates using likelihood-based filtering, and enforces global consistency through iterative resampling between overlapping segments. CDGS matches oracle performance on seven robot manipulation tasks, outperforming baselines that lack compositionality or require long-horizon training data. The approach generalizes across domains, enabling coherent text-guided panoramic images and long videos through effective local-to-global message passing. More details: https://cdgsearch.github.io/

翻译：生成模型已成为规划任务中的强大工具，其中组合方法通过组合局部模块化生成模型，为建模长时域任务分布提供了独特优势。这种组合范式涵盖多个领域，从多步操作规划到全景图像合成，再到长视频生成。然而，组合生成模型面临一个关键挑战：当局部分布呈多模态时，现有组合方法会对不兼容的模式进行平均，导致生成的规划既缺乏局部可行性又缺乏全局一致性。我们提出组合扩散引导搜索（CDGS），该方法通过将搜索直接嵌入扩散去噪过程来解决模式平均问题。我们的方法通过基于种群的采样探索局部模式的多样化组合，利用基于似然的过滤剪枝不可行候选方案，并通过重叠段之间的迭代重采样来保证全局一致性。CDGS在七项机器人操作任务中达到与基准方法相当的性能，优于缺乏组合性或需要长时域训练数据的基线方法。该方案具有良好的跨领域泛化能力，通过有效的局部到全局信息传递，实现了连贯的文本引导全景图像和长视频生成。更多细节请访问：https://cdgsearch.github.io/

0

相关内容

全域作战空间导引：引入“全地形规划”概念

全域作战空间导引：引入“全地形规划”概念

专知会员服务

16+阅读 · 2025年12月9日

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

专知会员服务

50+阅读 · 2025年11月21日

用于时间序列预测的扩散模型：综述

用于时间序列预测的扩散模型：综述

专知会员服务

29+阅读 · 2025年7月22日

医学影像中的高效扩散模型：全面综述

医学影像中的高效扩散模型：全面综述

专知会员服务

15+阅读 · 2025年5月26日

基于扩散模型和流模型的推理时引导生成技术

基于扩散模型和流模型的推理时引导生成技术

专知会员服务

16+阅读 · 2025年4月30日

高效扩散模型：从原理到实践的全面综述

高效扩散模型：从原理到实践的全面综述

专知会员服务

41+阅读 · 2024年10月16日

扩散模型概述：应用、引导生成、统计率和优化

扩散模型概述：应用、引导生成、统计率和优化

专知会员服务

47+阅读 · 2024年4月14日

长视频生成的综述：挑战、方法与前景

长视频生成的综述：挑战、方法与前景

专知会员服务

47+阅读 · 2024年3月26日

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

专知会员服务

87+阅读 · 2022年9月13日

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

专知会员服务

155+阅读 · 2022年9月5日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知

11+阅读 · 2022年4月10日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AI科技评论

13+阅读 · 2020年2月5日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

机器之心

18+阅读 · 2019年6月12日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

关于CNN图像分类的一份综合设计指南

关于CNN图像分类的一份综合设计指南

云栖社区

11+阅读 · 2018年5月15日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

基于地形辅助的深海长航时ARV自主导航技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

考虑产品间协同效应的多产品组合采购问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

“数据-知识”驱动的大区域高分辨率遥感影像多尺度分割并行计算方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于分层图结构化稀疏低秩表示的目标联合分割方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

Forward-Looking与Backward-Looking相结合的投资组合管理

国家自然科学基金

1+阅读 · 2014年12月31日

面向地图综合的多尺度空间聚类理论与方法

国家自然科学基金

1+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

Variable Search Stepsize for Randomized Local Search in Multi-Objective Combinatorial Optimization

Arxiv

0+阅读 · 2月5日

Flexible Multitask Learning with Factorized Diffusion Policy

Arxiv

0+阅读 · 2月1日

SanD-Planner: Sample-Efficient Diffusion Planner in B-Spline Space for Robust Local Navigation

Arxiv

0+阅读 · 1月31日

Diffusion models for multivariate subsurface generation and efficient probabilistic inversion

Arxiv

0+阅读 · 1月27日

DiffusionAgent: Navigating Expert Models for Agentic Image Generation

Arxiv

0+阅读 · 1月20日

POCI-Diff: Position Objects Consistently and Interactively with 3D-Layout Guided Diffusion

Arxiv

0+阅读 · 1月20日

Hierarchical Long Video Understanding with Audiovisual Entity Cohesion and Agentic Search

Arxiv

0+阅读 · 1月20日

Beyond Entangled Planning: Task-Decoupled Planning for Long-Horizon Agents

Arxiv

0+阅读 · 1月12日

Difficulty Controlled Diffusion Model for Synthesizing Effective Training Data

Arxiv

0+阅读 · 1月7日

Compositional Diffusion with Guided search for Long-Horizon Planning

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

相关VIP内容

全域作战空间导引：引入“全地形规划”概念

全域作战空间导引：引入“全地形规划”概念

专知会员服务

16+阅读 · 2025年12月9日

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

专知会员服务

50+阅读 · 2025年11月21日

用于时间序列预测的扩散模型：综述

用于时间序列预测的扩散模型：综述

专知会员服务

29+阅读 · 2025年7月22日

医学影像中的高效扩散模型：全面综述

医学影像中的高效扩散模型：全面综述

专知会员服务

15+阅读 · 2025年5月26日

基于扩散模型和流模型的推理时引导生成技术

基于扩散模型和流模型的推理时引导生成技术

专知会员服务

16+阅读 · 2025年4月30日

高效扩散模型：从原理到实践的全面综述

高效扩散模型：从原理到实践的全面综述

专知会员服务

41+阅读 · 2024年10月16日

扩散模型概述：应用、引导生成、统计率和优化

扩散模型概述：应用、引导生成、统计率和优化

专知会员服务

47+阅读 · 2024年4月14日

长视频生成的综述：挑战、方法与前景

长视频生成的综述：挑战、方法与前景

专知会员服务

47+阅读 · 2024年3月26日

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

专知会员服务

87+阅读 · 2022年9月13日

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

专知会员服务

155+阅读 · 2022年9月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知

11+阅读 · 2022年4月10日

最新《图嵌入组合优化》综述论文，40页pdf

最新《图嵌入组合优化》综述论文，40页pdf

专知

41+阅读 · 2020年8月31日

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AI科技评论

13+阅读 · 2020年2月5日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

机器之心

18+阅读 · 2019年6月12日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

关于CNN图像分类的一份综合设计指南

关于CNN图像分类的一份综合设计指南

云栖社区

11+阅读 · 2018年5月15日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

相关论文

Variable Search Stepsize for Randomized Local Search in Multi-Objective Combinatorial Optimization

Arxiv

0+阅读 · 2月5日

Flexible Multitask Learning with Factorized Diffusion Policy

Arxiv

0+阅读 · 2月1日

SanD-Planner: Sample-Efficient Diffusion Planner in B-Spline Space for Robust Local Navigation

Arxiv

0+阅读 · 1月31日

Diffusion models for multivariate subsurface generation and efficient probabilistic inversion

Arxiv

0+阅读 · 1月27日

DiffusionAgent: Navigating Expert Models for Agentic Image Generation

Arxiv

0+阅读 · 1月20日

POCI-Diff: Position Objects Consistently and Interactively with 3D-Layout Guided Diffusion

Arxiv

0+阅读 · 1月20日

Hierarchical Long Video Understanding with Audiovisual Entity Cohesion and Agentic Search

Arxiv

0+阅读 · 1月20日

Beyond Entangled Planning: Task-Decoupled Planning for Long-Horizon Agents

Arxiv

0+阅读 · 1月12日

Difficulty Controlled Diffusion Model for Synthesizing Effective Training Data

Arxiv

0+阅读 · 1月7日

Compositional Diffusion with Guided search for Long-Horizon Planning

Arxiv

0+阅读 · 2025年12月31日

相关基金

基于地形辅助的深海长航时ARV自主导航技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

考虑产品间协同效应的多产品组合采购问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

“数据-知识”驱动的大区域高分辨率遥感影像多尺度分割并行计算方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于分层图结构化稀疏低秩表示的目标联合分割方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

Forward-Looking与Backward-Looking相结合的投资组合管理

国家自然科学基金

1+阅读 · 2014年12月31日

面向地图综合的多尺度空间聚类理论与方法

国家自然科学基金

1+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

1+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员