GHOST: Hierarchical Sub-Goal Policies for Generalizing Robot Manipulation - 专知论文

会员服务 ·

0

分层 · Ghost（博客程序） · 操作 · 泛化 · 分解 ·

GHOST: Hierarchical Sub-Goal Policies for Generalizing Robot Manipulation

翻译：标题：GHOST：面向机器人操作泛化的分层子目标策略

Sriram Krishna,Ben Eisner,Haotian Zhan,Ying Yuan,Haoyu Zhen,Chuang Gan,Shubham Tulsiani,David Held

from arxiv, Accepted at RSS 2026

We present GHOST, a framework for learning visuomotor manipulation policies that generalize beyond the training distribution. GHOST factorizes control into (i) a high-level policy that predicts the next sub-goal as a distribution over 3D end-effector poses from multi-view RGB-D observations, and (ii) a low-level goal-conditioned controller that executes embodiment-specific actions. To condition image-based policies on 3D goals, we introduce a simple spatial interface that projects predicted goals into the image plane and represents them as end-effector heatmaps. Across a suite of manipulation tasks, this hierarchical factorization consistently improves performance and robustness compared to a flat Diffusion Policy. Further, we show that this hierarchical interface also makes it easy to incorporate human demonstrations without relying on (noisy) action retargeting. As sub-goals are largely embodiment-agnostic, we train the high-level policy on human video to specify how learned skills should be applied and composed, while keeping the low-level policy trained purely on robot data. This hierarchy enables adaptation to novel objects and task variations using a small number of human demonstrations.

翻译：摘要：我们提出GHOST框架，用于学习能泛化到训练分布之外的视觉运动操作策略。GHOST将控制分解为：（i）高层策略，根据多视角RGB-D观测预测下一个子目标在三维末端执行器姿态上的分布；（ii）低层目标条件控制器，执行具体具身动作。为将基于图像的策略与三维目标关联，我们引入简单空间接口，将预测目标投影至图像平面并以末端执行器热图形式表征。在一组操作任务中，这种分层分解相较于扁平扩散策略持续提升了性能与鲁棒性。进一步表明，该分层接口还能轻松融入人类示教数据而无需依赖（含噪声的）动作重定向。由于子目标很大程度上与具身形态无关，我们利用人类视频训练高层策略以指定学习技能的应用与组合方式，同时保持低层策略仅基于机器人数据训练。这种分层架构使系统能够通过少量人类示教数据适应新物体及任务变体。

0

相关内容

面向特种部队的、以操作员为中心的人工智能决策支持系统框架

面向特种部队的、以操作员为中心的人工智能决策支持系统框架

专知会员服务

12+阅读 · 6月11日

《支持作战级人机协同智能的交互式OODA流程》

《支持作战级人机协同智能的交互式OODA流程》

专知会员服务

24+阅读 · 6月7日

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

专知会员服务

24+阅读 · 4月18日

《从“分诊”到目标锁定：人工智能作战人员关键决策架构》

《从“分诊”到目标锁定：人工智能作战人员关键决策架构》

专知会员服务

38+阅读 · 1月31日

《基于Transformer的智能体的战术决策解释》

《基于Transformer的智能体的战术决策解释》

专知会员服务

49+阅读 · 2025年12月28日

《一种分层混合人工智能方法：在战斗模拟中整合深度强化学习与脚本代理》

《一种分层混合人工智能方法：在战斗模拟中整合深度强化学习与脚本代理》

专知会员服务

27+阅读 · 2025年12月6日

《基于分层多智能体强化学习的逼真空战协同策略》

《基于分层多智能体强化学习的逼真空战协同策略》

专知会员服务

47+阅读 · 2025年10月30日

《异步通信下的分布式武器-目标分配》

《异步通信下的分布式武器-目标分配》

专知会员服务

63+阅读 · 2024年6月21日

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

专知会员服务

22+阅读 · 2024年2月13日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

计算机视觉方向简介 | 多目标跟踪算法（附源码）

计算机视觉方向简介 | 多目标跟踪算法（附源码）

计算机视觉life

15+阅读 · 2019年6月26日

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

AI100

14+阅读 · 2019年3月9日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

目标跟踪算法分类

目标跟踪算法分类

大数据技术

13+阅读 · 2018年9月17日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

【论文推荐】最新5篇视觉目标跟踪相关论文—递归神经网络、深度适应计算策略、视觉目标跟踪基准、深度核化相关滤波、检测并跟踪

【论文推荐】最新5篇视觉目标跟踪相关论文—递归神经网络、深度适应计算策略、视觉目标跟踪基准、深度核化相关滤波、检测并跟踪

专知

14+阅读 · 2018年1月22日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

入门 | 一文概览视频目标分割

入门 | 一文概览视频目标分割

机器之心

10+阅读 · 2017年10月6日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

GAN生成式对抗网络

23+阅读 · 2017年9月14日

武器装备体系架构的跨领域组合决策分析与冲突消解方法

国家自然科学基金

122+阅读 · 2015年12月31日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

20+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

彩色/多光谱异源双目视频运动目标分割方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

基于调度采样的网络化系统分布式控制策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

14+阅读 · 2015年12月31日

高分辨率极化SAR图像对象化目标分解方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

APEX: Adaptive Policy Execution for Precise Manipulation

Arxiv

0+阅读 · 6月15日

X-Loco: Towards Generalist Humanoid Locomotion Control via Synergetic Policy Distillation

Arxiv

0+阅读 · 6月12日

GeoHAT: Geometry-Adaptive Hybrid Action Transformer for Mobile Manipulation

Arxiv

0+阅读 · 6月11日

What Matters in Orchestrating Robot Policies: A Systematic Study of Hierarchical VLA Agents

Arxiv

0+阅读 · 6月9日

Unifying Object-Centric World Models and Diffusion Policy: A Hierarchical Framework for Multi-Stage Robotic Tasks

Arxiv

0+阅读 · 6月7日

Dexterity-BEV: Aligning 3D World and Actions for Generalizable Robot Policies Learning

Arxiv

0+阅读 · 6月6日

SERNF: Sample-Efficient Real-World Dexterous Policy Fine-Tuning via Action-Chunked Critics and Normalizing Flows

Arxiv

0+阅读 · 6月5日

Spline Policy: A Structured Representation for Robot Policies

Arxiv

0+阅读 · 6月5日

SCRIPT: Scalable Diffusion Policy with Multi-stage Training for Language-driven Physics-Based Humanoid Control

Arxiv

0+阅读 · 5月21日

DreamPolicy: A Unified World-model Policy for Scalable Humanoid Locomotion

Arxiv

0+阅读 · 5月12日

VIP会员

文章信息

相关主题

Ghost（博客程序）

最新内容

五角大楼启动“智能体网络”以推进人工智能赋能的战斗管理与目标打击

五角大楼启动“智能体网络”以推进人工智能赋能的战斗管理与目标打击

专知会员服务

8+阅读 · 6月27日

2025年全球二十起重大无人机作战事件

2025年全球二十起重大无人机作战事件

专知会员服务

2+阅读 · 6月27日

现代战争的隐蔽系统：伊朗战争十大启示

现代战争的隐蔽系统：伊朗战争十大启示

专知会员服务

3+阅读 · 6月27日

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

5+阅读 · 6月26日

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

8+阅读 · 6月26日

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

15+阅读 · 6月26日

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

5+阅读 · 6月26日

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

4+阅读 · 6月26日

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

3+阅读 · 6月26日

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

8+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

7+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

9+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

9+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

相关VIP内容

面向特种部队的、以操作员为中心的人工智能决策支持系统框架

面向特种部队的、以操作员为中心的人工智能决策支持系统框架

专知会员服务

12+阅读 · 6月11日

《支持作战级人机协同智能的交互式OODA流程》

《支持作战级人机协同智能的交互式OODA流程》

专知会员服务

24+阅读 · 6月7日

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

专知会员服务

24+阅读 · 4月18日

《从“分诊”到目标锁定：人工智能作战人员关键决策架构》

《从“分诊”到目标锁定：人工智能作战人员关键决策架构》

专知会员服务

38+阅读 · 1月31日

《基于Transformer的智能体的战术决策解释》

《基于Transformer的智能体的战术决策解释》

专知会员服务

49+阅读 · 2025年12月28日

《一种分层混合人工智能方法：在战斗模拟中整合深度强化学习与脚本代理》

《一种分层混合人工智能方法：在战斗模拟中整合深度强化学习与脚本代理》

专知会员服务

27+阅读 · 2025年12月6日

《基于分层多智能体强化学习的逼真空战协同策略》

《基于分层多智能体强化学习的逼真空战协同策略》

专知会员服务

47+阅读 · 2025年10月30日

《异步通信下的分布式武器-目标分配》

《异步通信下的分布式武器-目标分配》

专知会员服务

63+阅读 · 2024年6月21日

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

专知会员服务

22+阅读 · 2024年2月13日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

热门VIP内容

开通专知VIP会员享更多权益服务

2025年全球二十起重大无人机作战事件

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

五角大楼启动“智能体网络”以推进人工智能赋能的战斗管理与目标打击

现代战争的隐蔽系统：伊朗战争十大启示

相关资讯

计算机视觉方向简介 | 多目标跟踪算法（附源码）

计算机视觉方向简介 | 多目标跟踪算法（附源码）

计算机视觉life

15+阅读 · 2019年6月26日

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

AI100

14+阅读 · 2019年3月9日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

目标跟踪算法分类

目标跟踪算法分类

大数据技术

13+阅读 · 2018年9月17日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

【论文推荐】最新5篇视觉目标跟踪相关论文—递归神经网络、深度适应计算策略、视觉目标跟踪基准、深度核化相关滤波、检测并跟踪

【论文推荐】最新5篇视觉目标跟踪相关论文—递归神经网络、深度适应计算策略、视觉目标跟踪基准、深度核化相关滤波、检测并跟踪

专知

14+阅读 · 2018年1月22日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

入门 | 一文概览视频目标分割

入门 | 一文概览视频目标分割

机器之心

10+阅读 · 2017年10月6日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

【分析】图像分类、目标检测、图像分割、图像生成……一文「计算机视觉」全分析

GAN生成式对抗网络

23+阅读 · 2017年9月14日

相关论文

APEX: Adaptive Policy Execution for Precise Manipulation

Arxiv

0+阅读 · 6月15日

X-Loco: Towards Generalist Humanoid Locomotion Control via Synergetic Policy Distillation

Arxiv

0+阅读 · 6月12日

GeoHAT: Geometry-Adaptive Hybrid Action Transformer for Mobile Manipulation

Arxiv

0+阅读 · 6月11日

What Matters in Orchestrating Robot Policies: A Systematic Study of Hierarchical VLA Agents

Arxiv

0+阅读 · 6月9日

Unifying Object-Centric World Models and Diffusion Policy: A Hierarchical Framework for Multi-Stage Robotic Tasks

Arxiv

0+阅读 · 6月7日

Dexterity-BEV: Aligning 3D World and Actions for Generalizable Robot Policies Learning

Arxiv

0+阅读 · 6月6日

SERNF: Sample-Efficient Real-World Dexterous Policy Fine-Tuning via Action-Chunked Critics and Normalizing Flows

Arxiv

0+阅读 · 6月5日

Spline Policy: A Structured Representation for Robot Policies

Arxiv

0+阅读 · 6月5日

SCRIPT: Scalable Diffusion Policy with Multi-stage Training for Language-driven Physics-Based Humanoid Control

Arxiv

0+阅读 · 5月21日

DreamPolicy: A Unified World-model Policy for Scalable Humanoid Locomotion

Arxiv

0+阅读 · 5月12日

相关基金

武器装备体系架构的跨领域组合决策分析与冲突消解方法

国家自然科学基金

122+阅读 · 2015年12月31日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

20+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

彩色/多光谱异源双目视频运动目标分割方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

基于调度采样的网络化系统分布式控制策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

14+阅读 · 2015年12月31日

高分辨率极化SAR图像对象化目标分解方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员