Hybrid Motion Planning with Deep Reinforcement Learning for Mobile Robot Navigation - 专知论文

会员服务 ·

0

混合 · 机器人导航 · 结构 · 路径 · 深度强化学习 ·

2025 年 12 月 31 日

Hybrid Motion Planning with Deep Reinforcement Learning for Mobile Robot Navigation

翻译：基于深度强化学习的移动机器人导航混合运动规划

Yury Kolomeytsev,Dmitry Golembiovsky

from arxiv, 22 pages, 4 figures

Autonomous mobile robots operating in complex, dynamic environments face the dual challenge of navigating large-scale, structurally diverse spaces with static obstacles while safely interacting with various moving agents. Traditional graph-based planners excel at long-range pathfinding but lack reactivity, while Deep Reinforcement Learning (DRL) methods demonstrate strong collision avoidance but often fail to reach distant goals due to a lack of global context. We propose Hybrid Motion Planning with Deep Reinforcement Learning (HMP-DRL), a hybrid framework that bridges this gap. Our approach utilizes a graph-based global planner to generate a path, which is integrated into a local DRL policy via a sequence of checkpoints encoded in both the state space and reward function. To ensure social compliance, the local planner employs an entity-aware reward structure that dynamically adjusts safety margins and penalties based on the semantic type of surrounding agents. We validate the proposed method through extensive testing in a realistic simulation environment derived from real-world map data. Comprehensive experiments demonstrate that HMP-DRL consistently outperforms other methods, including state-of-the-art approaches, in terms of key metrics of robot navigation: success rate, collision rate, and time to reach the goal. Overall, these findings confirm that integrating long-term path guidance with semantically-aware local control significantly enhances both the safety and reliability of autonomous navigation in complex human-centric settings.

翻译：在复杂动态环境中运行的自主移动机器人面临双重挑战：既要导航具有静态障碍物的大规模结构多样化空间，又要安全地与各类移动智能体进行交互。传统的基于图的规划器擅长长距离路径规划但缺乏反应能力，而深度强化学习方法虽展现出强大的避障能力，却常因缺乏全局上下文信息而无法抵达远距离目标。我们提出基于深度强化学习的混合运动规划框架，该混合框架有效弥合了这一鸿沟。我们的方法利用基于图的全局规划器生成路径，并通过编码在状态空间与奖励函数中的一系列检查点将其整合至局部深度强化学习策略中。为确保社会合规性，局部规划器采用实体感知的奖励结构，该结构能依据周围智能体的语义类型动态调整安全边界与惩罚项。我们在基于真实地图数据构建的逼真仿真环境中通过大量测试验证了所提方法。综合实验表明，在机器人导航的关键指标——成功率、碰撞率与抵达目标耗时方面，HMP-DRL 始终优于包括最先进方法在内的其他方法。总体而言，这些发现证实：将长期路径引导与语义感知的局部控制相结合，能显著提升复杂人本环境中自主导航的安全性与可靠性。

0

相关内容

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

28+阅读 · 2025年11月17日

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

专知会员服务

22+阅读 · 2025年5月30日

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

专知会员服务

16+阅读 · 2025年4月19日

【阿姆斯特丹博士论文】自主智能体导航的强化学习与规划：专注于稀疏奖励设置

【阿姆斯特丹博士论文】自主智能体导航的强化学习与规划：专注于稀疏奖励设置

专知会员服务

44+阅读 · 2024年3月28日

无人飞行器自主决策与规划技术综述

无人飞行器自主决策与规划技术综述

专知会员服务

44+阅读 · 2024年3月11日

面向机器人系统的虚实迁移强化学习综述

面向机器人系统的虚实迁移强化学习综述

专知会员服务

45+阅读 · 2024年2月8日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

35+阅读 · 2022年12月12日

「强化学习在无人车领域」的应用与展望

「强化学习在无人车领域」的应用与展望

专知会员服务

60+阅读 · 2022年12月8日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

66+阅读 · 2021年4月22日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

产业智能官

44+阅读 · 2018年12月11日

智能无人作战系统的发展

智能无人作战系统的发展

科技导报

36+阅读 · 2018年6月29日

李克强：智能车辆运动控制研究综述

李克强：智能车辆运动控制研究综述

厚势

21+阅读 · 2017年10月17日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Scene-Adaptive Motion Planning with Explicit Mixture of Experts and Interaction-Oriented Optimization

Arxiv

0+阅读 · 2月3日

Reinforcement Learning for Active Perception in Autonomous Navigation

Arxiv

0+阅读 · 2月1日

A Continual Offline Reinforcement Learning Benchmark for Navigation Tasks

Arxiv

0+阅读 · 1月30日

Advancing Improvisation in Human-Robot Construction Collaboration: Taxonomy and Research Roadmap

Arxiv

0+阅读 · 1月23日

AION: Aerial Indoor Object-Goal Navigation Using Dual-Policy Reinforcement Learning

Arxiv

0+阅读 · 1月22日

Proactive Local-Minima-Free Robot Navigation: Blending Motion Prediction with Safe Control

Arxiv

0+阅读 · 1月15日

Look as You Leap: Planning Simultaneous Motion and Perception for High-DOF Robots

Arxiv

0+阅读 · 1月13日

NMPC-Augmented Visual Navigation and Safe Learning Control for Large-Scale Mobile Robots

Arxiv

0+阅读 · 1月2日

Reinforcement learning with timed constraints for robotics motion planning

Arxiv

0+阅读 · 2025年12月31日

Hybrid A* Path Planning with Multi-Modal Motion Extension for Four-Wheel Steering Mobile Robots

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

机器人导航

深度强化学习

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

9+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

4+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

7+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

9+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

4+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

8+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

6+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

6+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

6+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

4+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

9+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

12+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

7+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

10+阅读 · 7月31日

相关VIP内容

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

28+阅读 · 2025年11月17日

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

《基于时序逻辑规范的移动机器人规划与控制研究进展》最新180页

专知会员服务

22+阅读 · 2025年5月30日

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

专知会员服务

16+阅读 · 2025年4月19日

【阿姆斯特丹博士论文】自主智能体导航的强化学习与规划：专注于稀疏奖励设置

【阿姆斯特丹博士论文】自主智能体导航的强化学习与规划：专注于稀疏奖励设置

专知会员服务

44+阅读 · 2024年3月28日

无人飞行器自主决策与规划技术综述

无人飞行器自主决策与规划技术综述

专知会员服务

44+阅读 · 2024年3月11日

面向机器人系统的虚实迁移强化学习综述

面向机器人系统的虚实迁移强化学习综述

专知会员服务

45+阅读 · 2024年2月8日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

35+阅读 · 2022年12月12日

「强化学习在无人车领域」的应用与展望

「强化学习在无人车领域」的应用与展望

专知会员服务

60+阅读 · 2022年12月8日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

66+阅读 · 2021年4月22日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

产业智能官

44+阅读 · 2018年12月11日

智能无人作战系统的发展

智能无人作战系统的发展

科技导报

36+阅读 · 2018年6月29日

李克强：智能车辆运动控制研究综述

李克强：智能车辆运动控制研究综述

厚势

21+阅读 · 2017年10月17日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Scene-Adaptive Motion Planning with Explicit Mixture of Experts and Interaction-Oriented Optimization

Arxiv

0+阅读 · 2月3日

Reinforcement Learning for Active Perception in Autonomous Navigation

Arxiv

0+阅读 · 2月1日

A Continual Offline Reinforcement Learning Benchmark for Navigation Tasks

Arxiv

0+阅读 · 1月30日

Advancing Improvisation in Human-Robot Construction Collaboration: Taxonomy and Research Roadmap

Arxiv

0+阅读 · 1月23日

AION: Aerial Indoor Object-Goal Navigation Using Dual-Policy Reinforcement Learning

Arxiv

0+阅读 · 1月22日

Proactive Local-Minima-Free Robot Navigation: Blending Motion Prediction with Safe Control

Arxiv

0+阅读 · 1月15日

Look as You Leap: Planning Simultaneous Motion and Perception for High-DOF Robots

Arxiv

0+阅读 · 1月13日

NMPC-Augmented Visual Navigation and Safe Learning Control for Large-Scale Mobile Robots

Arxiv

0+阅读 · 1月2日

Reinforcement learning with timed constraints for robotics motion planning

Arxiv

0+阅读 · 2025年12月31日

Hybrid A* Path Planning with Multi-Modal Motion Extension for Four-Wheel Steering Mobile Robots

Arxiv

0+阅读 · 2025年12月31日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

广域动态的野外环境中移动机器人六维全局定位方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员