Zero-shot object-goal navigation (ZSON) requires navigating unknown environments to find a target object without task-specific training. Prior hierarchical training-free solutions invest in scene understanding (\textit{belief}) and high-level decision-making (\textit{policy}), yet overlook the design of \textit{option}, i.e., a subgoal candidate proposed from evolving belief and presented to policy for selection. In practice, options are reduced to isolated waypoints scored independently: single destinations hide the value gathered along the journey; an unstructured collection obscures the relationships among candidates. Our insight is that the option space should be a \textit{tree of paths}. Full paths expose en-route information gain that destination-only scoring systematically neglects; a tree of shared segments enables coarse-to-fine LLM reasoning that dismisses or pursues entire branches before examining individual leaves, compressing the combinatorial path space into an efficient hierarchy. We instantiate this insight in \textbf{REST} (Receding Horizon Explorative Steiner Tree), a training-free framework that (1) builds an explicit open-vocabulary 3D map from online RGB-D streams; (2) grows an agent-centric tree of safe and informative paths as the option space via sampling-based planning; and (3) textualizes each branch into a spatial narrative and selects the next-best path through chain-of-thought LLM reasoning. Across the Gibson, HM3D, and HSSD benchmarks, REST consistently ranks among the top methods in success rate while achieving the best or second-best path efficiency, demonstrating a favorable efficiency-success balance.


翻译:零样本目标导向导航(ZSON)要求在不经过任务特定训练的情况下,在未知环境中导航以找到目标物体。现有的分层无训练解决方案侧重于场景理解(信念)和高层决策(策略),却忽视了选项设计——即从动态信念中生成子目标候选,并提交给策略进行选择。实际应用中,选项被简化为独立评分的孤立航点:单一目的地隐藏了沿途获取的价值;非结构化集合则模糊了候选点间的关联。我们的洞见是:选项空间应为路径树。完整路径暴露了仅以目的地评分会系统性忽略的途中信息增益;由共享路径段构成的树结构支持从粗到细的LLM推理——在检查单个叶节点前即可拒绝或采纳整条分支,将组合爆炸的路径空间压缩为高效层次结构。我们将这一洞见实例化为REST(递推视界探索施泰纳树),一个无训练框架,其(1)从在线RGB-D流构建显式开放词汇3D地图;(2)通过基于采样的规划,以智能体为中心生成安全且信息丰富的路径树作为选项空间;(3)将每条分支转换为空间叙事文本,并通过链式思考LLM推理选择最优路径。在Gibson、HM3D和HSSD基准测试中,REST在成功率上始终位居顶尖方法之列,同时实现最佳或次优的路径效率,展现出优秀的高效性与成功率平衡。

0
下载
关闭预览

相关内容

【CVPR2024】渐进式语义引导视觉变换器用于零样本学习
专知会员服务
19+阅读 · 2024年4月13日
【WWW2021】本体增强零样本学习
专知会员服务
37+阅读 · 2021年2月26日
专知会员服务
40+阅读 · 2020年6月19日
Zero-Shot Learning相关资源大列表
专知
52+阅读 · 2019年1月1日
图上的归纳表示学习
科技创新与创业
23+阅读 · 2017年11月9日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
VIP会员
最新内容
重新思考无人机时代的生存能力
专知会员服务
3+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
3+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
4+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
4+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
5+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员