Visual Prompt Guided Unified Pushing Policy - 专知论文

会员服务 ·

0

基元 · 视觉提示 · 操作 · 多模 · 模态 ·

Visual Prompt Guided Unified Pushing Policy

翻译：视觉提示引导的统一推动策略

Hieu Bui,Ziyan Gao,Yuya Hosoda,Joo-Ho Lee

As one of the simplest non-prehensile manipulation skills, pushing has been widely studied as an effective means to rearrange objects. Existing approaches, however, typically rely on multi-step push plans composed of pre-defined pushing primitives with limited application scopes, which restrict their efficiency and versatility across different scenarios. In this work, we propose a unified pushing policy that incorporates a lightweight prompting mechanism into a flow matching policy to guide the generation of reactive, multimodal pushing actions. The visual prompt can be specified by a high-level planner, enabling the reuse of the pushing policy across a wide range of planning problems. Experimental results demonstrate that the proposed unified pushing policy not only outperforms existing baselines but also effectively serves as a low-level primitive within a VLM-guided planning framework to solve table-cleaning tasks efficiently.

翻译：作为最简单的非抓取式操作技能之一，推动已被广泛研究为一种有效的物体重排手段。然而，现有方法通常依赖于由预定义推动基元组成的多步推动计划，这些基元的应用范围有限，从而限制了其在不同场景下的效率和通用性。在本工作中，我们提出了一种统一的推动策略，它将一种轻量级的提示机制融入流匹配策略，以指导生成反应式、多模态的推动动作。视觉提示可由高层规划器指定，使得该推动策略能够在广泛的规划问题中重复使用。实验结果表明，所提出的统一推动策略不仅优于现有基线方法，还能有效地作为VLM引导规划框架中的底层基元，高效解决桌面清理任务。

0

相关内容

【WWW2026】用于多模态推荐的基础模型个性化参数高效微调研究

【WWW2026】用于多模态推荐的基础模型个性化参数高效微调研究

专知会员服务

5+阅读 · 2月20日

《推荐可行策略：将分析框架与决策启发式方法相结合的语义方法》

《推荐可行策略：将分析框架与决策启发式方法相结合的语义方法》

专知会员服务

22+阅读 · 2025年2月25日

自动化提示工程综述：一种优化视角

自动化提示工程综述：一种优化视角

专知会员服务

28+阅读 · 2025年2月18日

推荐系统融合排序的多目标寻优技术

推荐系统融合排序的多目标寻优技术

专知会员服务

19+阅读 · 2024年8月17日

视觉提示学习综述

视觉提示学习综述

专知会员服务

55+阅读 · 2024年3月23日

【WWW2024】GraphPro：推荐系统中的图预训练与提示学习

【WWW2024】GraphPro：推荐系统中的图预训练与提示学习

专知会员服务

23+阅读 · 2024年1月26日

【ICDM2022教程】多目标优化与推荐，173页ppt

【ICDM2022教程】多目标优化与推荐，173页ppt

专知会员服务

47+阅读 · 2022年12月24日

【RecSys22教程】多阶段推荐系统的神经重排序，90页ppt

【RecSys22教程】多阶段推荐系统的神经重排序，90页ppt

专知会员服务

27+阅读 · 2022年9月30日

【WWW2021】面向推荐学习公平表示：一种图视角

专知会员服务

30+阅读 · 2021年2月21日

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

专知会员服务

52+阅读 · 2021年1月11日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

新书推荐《推荐系统进展：方法与技术》

新书推荐《推荐系统进展：方法与技术》

LibRec智能推荐

13+阅读 · 2019年3月18日

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

PMCAFF

10+阅读 · 2019年3月14日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

【干货】基于协同过滤的推荐系统实战（附完整代码）

【干货】基于协同过滤的推荐系统实战（附完整代码）

专知

76+阅读 · 2018年4月5日

【推荐系统】详解基于内容的推荐算法

【推荐系统】详解基于内容的推荐算法

产业智能官

23+阅读 · 2018年1月11日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

深度学习探索

13+阅读 · 2017年7月16日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

9+阅读 · 2015年12月31日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

20+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于压电效应和液晶引流效应微流体组合驱动控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

移动终端视频目标快速识别技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

自动化集装箱码头装卸作业的时空同步策略与优化方法

国家自然科学基金

1+阅读 · 2014年12月31日

From Local Indices to Global Identifiers: Generative Reranking for Recommender Systems via Global Action Space

Arxiv

0+阅读 · 4月28日

OneVL: One-Step Latent Reasoning and Planning with Vision-Language Explanation

Arxiv

0+阅读 · 4月20日

DockAnywhere: Data-Efficient Visuomotor Policy Learning for Mobile Manipulation via Novel Demonstration Generation

Arxiv

0+阅读 · 4月16日

Progress-Think: Semantic Progress Reasoning for Vision-Language Navigation

Arxiv

0+阅读 · 4月14日

Visual Decoding Operators: Towards a Compositional Theory of Visualization Perception

Arxiv

0+阅读 · 4月2日

ProgressVLA: Progress-Guided Diffusion Policy for Vision-Language Robotic Manipulation

Arxiv

0+阅读 · 3月29日

UniGRPO: Unified Policy Optimization for Reasoning-Driven Visual Generation

Arxiv

0+阅读 · 3月24日

PreferRec: Learning and Transferring Pareto Preferences for Multi-objective Re-ranking

Arxiv

0+阅读 · 3月23日

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

Arxiv

0+阅读 · 3月10日

AdaWorldPolicy: World-Model-Driven Diffusion Policy with Online Adaptive Learning for Robotic Manipulation

Arxiv

0+阅读 · 2月23日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

【WWW2026】用于多模态推荐的基础模型个性化参数高效微调研究

【WWW2026】用于多模态推荐的基础模型个性化参数高效微调研究

专知会员服务

5+阅读 · 2月20日

《推荐可行策略：将分析框架与决策启发式方法相结合的语义方法》

《推荐可行策略：将分析框架与决策启发式方法相结合的语义方法》

专知会员服务

22+阅读 · 2025年2月25日

自动化提示工程综述：一种优化视角

自动化提示工程综述：一种优化视角

专知会员服务

28+阅读 · 2025年2月18日

推荐系统融合排序的多目标寻优技术

推荐系统融合排序的多目标寻优技术

专知会员服务

19+阅读 · 2024年8月17日

视觉提示学习综述

视觉提示学习综述

专知会员服务

55+阅读 · 2024年3月23日

【WWW2024】GraphPro：推荐系统中的图预训练与提示学习

【WWW2024】GraphPro：推荐系统中的图预训练与提示学习

专知会员服务

23+阅读 · 2024年1月26日

【ICDM2022教程】多目标优化与推荐，173页ppt

【ICDM2022教程】多目标优化与推荐，173页ppt

专知会员服务

47+阅读 · 2022年12月24日

【RecSys22教程】多阶段推荐系统的神经重排序，90页ppt

【RecSys22教程】多阶段推荐系统的神经重排序，90页ppt

专知会员服务

27+阅读 · 2022年9月30日

【WWW2021】面向推荐学习公平表示：一种图视角

专知会员服务

30+阅读 · 2021年2月21日

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

专知会员服务

52+阅读 · 2021年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

新书推荐《推荐系统进展：方法与技术》

新书推荐《推荐系统进展：方法与技术》

LibRec智能推荐

13+阅读 · 2019年3月18日

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

PMCAFF

10+阅读 · 2019年3月14日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

【干货】基于协同过滤的推荐系统实战（附完整代码）

【干货】基于协同过滤的推荐系统实战（附完整代码）

专知

76+阅读 · 2018年4月5日

【推荐系统】详解基于内容的推荐算法

【推荐系统】详解基于内容的推荐算法

产业智能官

23+阅读 · 2018年1月11日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

深度学习探索

13+阅读 · 2017年7月16日

相关论文

From Local Indices to Global Identifiers: Generative Reranking for Recommender Systems via Global Action Space

Arxiv

0+阅读 · 4月28日

OneVL: One-Step Latent Reasoning and Planning with Vision-Language Explanation

Arxiv

0+阅读 · 4月20日

DockAnywhere: Data-Efficient Visuomotor Policy Learning for Mobile Manipulation via Novel Demonstration Generation

Arxiv

0+阅读 · 4月16日

Progress-Think: Semantic Progress Reasoning for Vision-Language Navigation

Arxiv

0+阅读 · 4月14日

Visual Decoding Operators: Towards a Compositional Theory of Visualization Perception

Arxiv

0+阅读 · 4月2日

ProgressVLA: Progress-Guided Diffusion Policy for Vision-Language Robotic Manipulation

Arxiv

0+阅读 · 3月29日

UniGRPO: Unified Policy Optimization for Reasoning-Driven Visual Generation

Arxiv

0+阅读 · 3月24日

PreferRec: Learning and Transferring Pareto Preferences for Multi-objective Re-ranking

Arxiv

0+阅读 · 3月23日

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

Arxiv

0+阅读 · 3月10日

AdaWorldPolicy: World-Model-Driven Diffusion Policy with Online Adaptive Learning for Robotic Manipulation

Arxiv

0+阅读 · 2月23日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

9+阅读 · 2015年12月31日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

20+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于压电效应和液晶引流效应微流体组合驱动控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

移动终端视频目标快速识别技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

自动化集装箱码头装卸作业的时空同步策略与优化方法

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员