Integrating Deep RL and Bayesian Inference for ObjectNav in Mobile Robotics - 专知论文

会员服务 ·

0

Integrating Deep RL and Bayesian Inference for ObjectNav in Mobile Robotics

翻译：集成深度强化学习与贝叶斯推理的移动机器人目标导航

João Castelo-Branco,José Santos-Victor,Alexandre Bernardino

from arxiv, Accepted and to be published in the ICARSC 2026 26th IEEE International Conference on Autonomous Robot Systems and Competitions

Autonomous object search is challenging for mobile robots operating in indoor environments due to partial observability, perceptual uncertainty, and the need to trade off exploration and navigation efficiency. Classical probabilistic approaches explicitly represent uncertainty but typically rely on handcrafted action-selection heuristics, while deep reinforcement learning enables adaptive policies but often suffers from slow convergence and limited interpretability. This paper proposes a hybrid object-search framework that integrates Bayesian inference with deep reinforcement learning. The method maintains a spatial belief map over target locations, updated online through Bayesian inference from calibrated object detections, and trains a reinforcement learning policy to select navigation actions directly from this probabilistic representation. The approach is evaluated in realistic indoor simulation using Habitat 3.0 and compared against developed baseline strategies. Across two indoor environments, the proposed method improves success rate while reducing search effort. Overall, the results support the value of combining Bayesian belief estimation with learned action selection to achieve more efficient and reliable objectsearch behavior under partial observability.

翻译：自主目标搜索对室内环境中的移动机器人构成挑战，原因在于部分可观测性、感知不确定性以及探索与导航效率之间的权衡需求。经典概率方法虽能显式表示不确定性，但通常依赖手工设计的动作选择启发式策略；而深度强化学习虽能实现自适应策略，却常面临收敛缓慢和可解释性有限的问题。本文提出一种融合贝叶斯推理与深度强化学习的混合目标搜索框架。该方法维护目标位置的空间置信地图，通过基于标定目标检测结果的贝叶斯推理实现在线更新，并训练强化学习策略直接从该概率表征中选取导航动作。在Habitat 3.0平台上的逼真室内仿真环境中，本方法经与所开发的基线策略对比评估后发现：在两种室内场景下，所提方法在减少搜索代价的同时提升了成功率。总体而言，实验结果证明了将贝叶斯置信估计与学习型动作选择相结合，可在部分可观测条件下实现更高效可靠的目标搜索行为。

0

相关内容

【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合

【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合

专知会员服务

14+阅读 · 2025年10月25日

基于深度学习的无人机目标检测研究综述

基于深度学习的无人机目标检测研究综述

专知会员服务

108+阅读 · 2023年6月22日

【机器人自主导航】《移动与机动人工智能（AIMM）世界模型进展报告：路线侦察中的空间概念》美陆军25页技术报告

【机器人自主导航】《移动与机动人工智能（AIMM）世界模型进展报告：路线侦察中的空间概念》美陆军25页技术报告

专知会员服务

65+阅读 · 2022年12月18日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

35+阅读 · 2022年12月12日

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知会员服务

36+阅读 · 2022年8月16日

《使用模型预测控制和博弈论方法的移动机器人实时控制》140页博士论文

《使用模型预测控制和博弈论方法的移动机器人实时控制》140页博士论文

专知会员服务

56+阅读 · 2022年6月16日

面向移动增强现实的实时深度学习目标检测方法综述

专知会员服务

22+阅读 · 2021年10月9日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

66+阅读 · 2021年4月22日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

【目标跟踪 | 2019最新综述】视觉跟踪器的回顾及其在移动机器人中的应用分析，附25页PDF，174篇参考文献，A Review of Visual Trackers and Analysis of its Application to Mobile Robot

【目标跟踪 | 2019最新综述】视觉跟踪器的回顾及其在移动机器人中的应用分析，附25页PDF，174篇参考文献，A Review of Visual Trackers and Analysis of its Application to Mobile Robot

专知会员服务

26+阅读 · 2019年11月15日

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

19+阅读 · 2022年7月30日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

GAN生成式对抗网络

11+阅读 · 2018年6月5日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

机器学习研究会

21+阅读 · 2018年1月21日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

面向无人机基于在线场景建模的室外目标检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Deep Reinforcement Learning for Robotic Manipulation under Distribution Shift with Bounded Extremum Seeking

Arxiv

0+阅读 · 4月1日

VL-Nav: A Neuro-Symbolic Approach for Reasoning-based Vision-Language Navigation

Arxiv

0+阅读 · 3月23日

Interpreting Context-Aware Human Preferences for Multi-Objective Robot Navigation

Arxiv

0+阅读 · 3月18日

vAccSOL: Efficient and Transparent AI Vision Offloading for Mobile Robots

Arxiv

0+阅读 · 3月17日

Underwater Embodied Intelligence for Autonomous Robots: A Constraint-Coupled Perspective on Planning, Control, and Deployment

Arxiv

1+阅读 · 3月8日

Accelerating Robotic Reinforcement Learning with Agent Guidance

Arxiv

0+阅读 · 3月7日

Decision-Driven Semantic Object Exploration for Legged Robots via Confidence-Calibrated Perception and Topological Subgoal Selection

Arxiv

0+阅读 · 3月6日

Knowledge-driven Reasoning for Mobile Agentic AI: Concepts, Approaches, and Directions

Arxiv

0+阅读 · 3月6日

COMRES-VLM: Coordinated Multi-Robot Exploration and Search using Vision Language Models

Arxiv

0+阅读 · 3月1日

Task-oriented grasping for dexterous robots using postural synergies and reinforcement learning

Arxiv

0+阅读 · 2月24日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

4+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

6+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

6+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

22+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合

【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合

专知会员服务

14+阅读 · 2025年10月25日

基于深度学习的无人机目标检测研究综述

基于深度学习的无人机目标检测研究综述

专知会员服务

108+阅读 · 2023年6月22日

【机器人自主导航】《移动与机动人工智能（AIMM）世界模型进展报告：路线侦察中的空间概念》美陆军25页技术报告

【机器人自主导航】《移动与机动人工智能（AIMM）世界模型进展报告：路线侦察中的空间概念》美陆军25页技术报告

专知会员服务

65+阅读 · 2022年12月18日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

35+阅读 · 2022年12月12日

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知会员服务

36+阅读 · 2022年8月16日

《使用模型预测控制和博弈论方法的移动机器人实时控制》140页博士论文

《使用模型预测控制和博弈论方法的移动机器人实时控制》140页博士论文

专知会员服务

56+阅读 · 2022年6月16日

面向移动增强现实的实时深度学习目标检测方法综述

专知会员服务

22+阅读 · 2021年10月9日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

66+阅读 · 2021年4月22日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

【目标跟踪 | 2019最新综述】视觉跟踪器的回顾及其在移动机器人中的应用分析，附25页PDF，174篇参考文献，A Review of Visual Trackers and Analysis of its Application to Mobile Robot

【目标跟踪 | 2019最新综述】视觉跟踪器的回顾及其在移动机器人中的应用分析，附25页PDF，174篇参考文献，A Review of Visual Trackers and Analysis of its Application to Mobile Robot

专知会员服务

26+阅读 · 2019年11月15日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

19+阅读 · 2022年7月30日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

八千字长文深度解读，迁移学习在强化学习中的应用及最新进展

机器之心

13+阅读 · 2019年10月17日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

GAN生成式对抗网络

11+阅读 · 2018年6月5日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

机器学习研究会

21+阅读 · 2018年1月21日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Deep Reinforcement Learning for Robotic Manipulation under Distribution Shift with Bounded Extremum Seeking

Arxiv

0+阅读 · 4月1日

VL-Nav: A Neuro-Symbolic Approach for Reasoning-based Vision-Language Navigation

Arxiv

0+阅读 · 3月23日

Interpreting Context-Aware Human Preferences for Multi-Objective Robot Navigation

Arxiv

0+阅读 · 3月18日

vAccSOL: Efficient and Transparent AI Vision Offloading for Mobile Robots

Arxiv

0+阅读 · 3月17日

Underwater Embodied Intelligence for Autonomous Robots: A Constraint-Coupled Perspective on Planning, Control, and Deployment

Arxiv

1+阅读 · 3月8日

Accelerating Robotic Reinforcement Learning with Agent Guidance

Arxiv

0+阅读 · 3月7日

Decision-Driven Semantic Object Exploration for Legged Robots via Confidence-Calibrated Perception and Topological Subgoal Selection

Arxiv

0+阅读 · 3月6日

Knowledge-driven Reasoning for Mobile Agentic AI: Concepts, Approaches, and Directions

Arxiv

0+阅读 · 3月6日

COMRES-VLM: Coordinated Multi-Robot Exploration and Search using Vision Language Models

Arxiv

0+阅读 · 3月1日

Task-oriented grasping for dexterous robots using postural synergies and reinforcement learning

Arxiv

0+阅读 · 2月24日

相关基金

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

面向无人机基于在线场景建模的室外目标检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员