基于学习感知物体搜索的缺失物体有效任务规划 (Effective Task Planning with Missing Objects using Learning-Informed Object Search) - 专知论文

会员服务 ·

0

搜索 · 任务规划 · 知识 · 不确定 · 不确定性 ·

Effective Task Planning with Missing Objects using Learning-Informed Object Search

翻译：基于学习感知物体搜索的缺失物体有效任务规划

Raihan Islam Arnob,Max Merlin,Abhishek Paudel,Benned Hedegaard,George Konidaris,Gregory Stein

Task planning for mobile robots often assumes full environment knowledge and so popular approaches, like planning via the PDDL, cannot plan when the locations of task-critical objects are unknown. Recent learning-driven object search approaches are effective, but operate as standalone tools and so are not straightforwardly incorporated into full task planners, which must additionally determine both what objects are necessary and when in the plan they should be sought out. To address this limitation, we develop a planning framework centered around novel model-based LIOS actions: each a policy that aims to find and retrieve a single object. High-level planning treats LIOS actions as deterministic and so -- informed by model-based calculations of the expected cost of each -- generates plans that interleave search and execution for effective, sound, and complete learning-informed task planning despite uncertainty. Our work effectively reasons about uncertainty while maintaining compatibility with existing full-knowledge solvers. In simulated ProcTHOR homes and in the real world, our approach outperforms non-learned and learned baselines on tasks including retrieval and meal prep.

翻译：移动机器人的任务规划通常假设具备完整的环境知识，因此诸如通过PDDL进行规划等主流方法在任务关键物体的位置未知时无法进行规划。近期基于学习的物体搜索方法虽然有效，但作为独立工具运行，难以直接整合到完整的任务规划器中——后者还需确定哪些物体是必需的以及应在计划何时进行搜寻。为突破这一局限，我们开发了一个以新型基于模型的LIOS动作为核心的规划框架：每个动作均为旨在寻找并获取单个物体的策略。高层规划将LIOS动作视为确定性操作，并基于对各动作预期成本的模型化计算，生成交替进行搜索与执行的规划方案，从而在不确定性条件下实现高效、可靠且完备的学习感知任务规划。本工作在对不确定性进行有效推理的同时，保持了与现有全知识求解器的兼容性。在模拟的ProcTHOR家居环境及现实场景中，我们的方法在物品检索与餐食制备等任务上均优于非学习型及学习型基线方法。

0

相关内容

互联网

【牛津博士论文】在不确定环境中的情境化决策制定

【牛津博士论文】在不确定环境中的情境化决策制定

专知会员服务

23+阅读 · 2025年11月20日

面向空间机器人辅助操作的任务规划方法研究

面向空间机器人辅助操作的任务规划方法研究

专知会员服务

21+阅读 · 2025年2月10日

空间智能如何？牛津大学博士论文《深度具身智能体的空间推理与规划》230页pdf

空间智能如何？牛津大学博士论文《深度具身智能体的空间推理与规划》230页pdf

专知会员服务

58+阅读 · 2024年10月23日

【牛津大学博士论文】深度具身智能体的空间推理与规划

【牛津大学博士论文】深度具身智能体的空间推理与规划

专知会员服务

45+阅读 · 2024年10月2日

《理解人工智能对作战人员的局限性：第 5 卷，任务规划》2024最新35页报告

《理解人工智能对作战人员的局限性：第 5 卷，任务规划》2024最新35页报告

专知会员服务

114+阅读 · 2024年1月25日

【斯坦福博士论文】具身物体搜索的操作与推理方法

【斯坦福博士论文】具身物体搜索的操作与推理方法

专知会员服务

39+阅读 · 2023年9月13日

有人/ 无人集群任务规划系统集成框架

有人/ 无人集群任务规划系统集成框架

专知会员服务

179+阅读 · 2023年6月14日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

34+阅读 · 2022年12月12日

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

专知会员服务

235+阅读 · 2022年4月10日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知

11+阅读 · 2022年4月10日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

【论文推荐】最新九篇目标检测相关论文—常识性知识转移、尺度不敏感、多尺度位置感知、渐进式域适应、时间感知特征图、人机合作

【论文推荐】最新九篇目标检测相关论文—常识性知识转移、尺度不敏感、多尺度位置感知、渐进式域适应、时间感知特征图、人机合作

专知

17+阅读 · 2018年4月11日

【知识图谱】一个有效的知识图谱是如何构建的？

【知识图谱】一个有效的知识图谱是如何构建的？

产业智能官

57+阅读 · 2018年4月5日

基于复杂耦合时间线的深空探测器自主任务规划方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

50+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

Arxiv

0+阅读 · 2月18日

Integrated Exploration and Sequential Manipulation on Scene Graph with LLM-based Situated Replanning

Arxiv

0+阅读 · 2月14日

Effective Task Planning with Missing Objects using Learning-Informed Object Search

Arxiv

0+阅读 · 2月13日

SafeFlowMPC: Predictive and Safe Trajectory Planning for Robot Manipulators with Learning-based Policies

Arxiv

0+阅读 · 2月13日

STaR: Scalable Task-Conditioned Retrieval for Long-Horizon Multimodal Robot Memory

Arxiv

0+阅读 · 2月9日

Crowd-FM: Learned Optimal Selection of Conditional Flow Matching-generated Trajectories for Crowd Navigation

Arxiv

0+阅读 · 2月6日

Evaluating Robustness and Adaptability in Learning-Based Mission Planning for Active Debris Removal

Arxiv

0+阅读 · 2月4日

A Continual Offline Reinforcement Learning Benchmark for Navigation Tasks

Arxiv

0+阅读 · 1月30日

A Methodology for Designing Knowledge-Driven Missions for Robots

Arxiv

0+阅读 · 1月28日

Beyond Task and Motion Planning: Hierarchical Robot Planning with General-Purpose Skills

Arxiv

1+阅读 · 1月17日

VIP会员

文章信息

相关主题

相关VIP内容

【牛津博士论文】在不确定环境中的情境化决策制定

【牛津博士论文】在不确定环境中的情境化决策制定

专知会员服务

23+阅读 · 2025年11月20日

面向空间机器人辅助操作的任务规划方法研究

面向空间机器人辅助操作的任务规划方法研究

专知会员服务

21+阅读 · 2025年2月10日

空间智能如何？牛津大学博士论文《深度具身智能体的空间推理与规划》230页pdf

空间智能如何？牛津大学博士论文《深度具身智能体的空间推理与规划》230页pdf

专知会员服务

58+阅读 · 2024年10月23日

【牛津大学博士论文】深度具身智能体的空间推理与规划

【牛津大学博士论文】深度具身智能体的空间推理与规划

专知会员服务

45+阅读 · 2024年10月2日

《理解人工智能对作战人员的局限性：第 5 卷，任务规划》2024最新35页报告

《理解人工智能对作战人员的局限性：第 5 卷，任务规划》2024最新35页报告

专知会员服务

114+阅读 · 2024年1月25日

【斯坦福博士论文】具身物体搜索的操作与推理方法

【斯坦福博士论文】具身物体搜索的操作与推理方法

专知会员服务

39+阅读 · 2023年9月13日

有人/ 无人集群任务规划系统集成框架

有人/ 无人集群任务规划系统集成框架

专知会员服务

179+阅读 · 2023年6月14日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

34+阅读 · 2022年12月12日

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

专知会员服务

235+阅读 · 2022年4月10日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

【硬核书】规划算法 (Planning Algorithm)，1023页pdf，Steven M. Illinois大学

专知

11+阅读 · 2022年4月10日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

【论文推荐】最新九篇目标检测相关论文—常识性知识转移、尺度不敏感、多尺度位置感知、渐进式域适应、时间感知特征图、人机合作

【论文推荐】最新九篇目标检测相关论文—常识性知识转移、尺度不敏感、多尺度位置感知、渐进式域适应、时间感知特征图、人机合作

专知

17+阅读 · 2018年4月11日

【知识图谱】一个有效的知识图谱是如何构建的？

【知识图谱】一个有效的知识图谱是如何构建的？

产业智能官

57+阅读 · 2018年4月5日

相关论文

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

Arxiv

0+阅读 · 2月18日

Integrated Exploration and Sequential Manipulation on Scene Graph with LLM-based Situated Replanning

Arxiv

0+阅读 · 2月14日

Effective Task Planning with Missing Objects using Learning-Informed Object Search

Arxiv

0+阅读 · 2月13日

SafeFlowMPC: Predictive and Safe Trajectory Planning for Robot Manipulators with Learning-based Policies

Arxiv

0+阅读 · 2月13日

STaR: Scalable Task-Conditioned Retrieval for Long-Horizon Multimodal Robot Memory

Arxiv

0+阅读 · 2月9日

Crowd-FM: Learned Optimal Selection of Conditional Flow Matching-generated Trajectories for Crowd Navigation

Arxiv

0+阅读 · 2月6日

Evaluating Robustness and Adaptability in Learning-Based Mission Planning for Active Debris Removal

Arxiv

0+阅读 · 2月4日

A Continual Offline Reinforcement Learning Benchmark for Navigation Tasks

Arxiv

0+阅读 · 1月30日

A Methodology for Designing Knowledge-Driven Missions for Robots

Arxiv

0+阅读 · 1月28日

Beyond Task and Motion Planning: Hierarchical Robot Planning with General-Purpose Skills

Arxiv

1+阅读 · 1月17日

相关基金

基于复杂耦合时间线的深空探测器自主任务规划方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

50+阅读 · 2015年12月31日

面向物联网搜索的群智感知关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员