Navigating through dense human crowds remains a significant challenge for mobile robots. A key issue is the freezing robot problem, where the robot struggles to find safe motions and becomes stuck within the crowd. To address this, we propose HiCrowd, a hierarchical framework that integrates reinforcement learning (RL) with model predictive control (MPC). HiCrowd leverages surrounding pedestrian motion as guidance, enabling the robot to align with compatible crowd flows. A high-level RL policy generates a follow point to align the robot with a suitable pedestrian group, while a low-level MPC safely tracks this guidance with short horizon planning. The method combines long-term crowd aware decision making with safe short-term execution. We evaluate HiCrowd against reactive and learning-based baselines in offline setting (replaying recorded human trajectories) and online setting (human trajectories are updated to react to the robot in simulation). Experiments on a real-world dataset and a synthetic crowd dataset show that our method outperforms in navigation efficiency and safety, while reducing freezing behaviors. Our results suggest that leveraging human motion as guidance, rather than treating humans solely as dynamic obstacles, provides a powerful principle for safe and efficient robot navigation in crowds.


翻译:在密集人群中导航对移动机器人而言仍是一项重大挑战。其核心问题在于“机器人冻结”现象,即机器人难以找到安全运动路径而停滞于人群之中。为此,我们提出HiCrowd——一种将强化学习(RL)与模型预测控制(MPC)相结合的层级化框架。HiCrowd利用周围行人运动作为引导,使机器人能够与相容的人流方向保持对齐。高层RL策略生成跟随点以引导机器人融入合适的人群组,而低层MPC则通过短时域规划安全地跟踪该引导。该方法将长期人群感知决策与安全的短期执行相结合。我们在离线场景(回放记录的人类轨迹)和在线场景(仿真中人类轨迹根据机器人行为动态更新)下,将HiCrowd与反应式及基于学习的基线方法进行比较。在真实世界数据集和合成人群数据集上的实验表明,本方法在导航效率与安全性方面均表现优异,同时有效减少了冻结行为。研究结果揭示:将人类运动视为引导而非单纯动态障碍物,为机器人在人群中的安全高效导航提供了重要原则。

0
下载
关闭预览

相关内容

机器人(英语:Robot)包括一切模拟人类行为或思想与模拟其他生物的机械(如机器狗,机器猫等)。狭义上对机器人的定义还有很多分类法及争议,有些电脑程序甚至也被称为机器人。在当代工业中,机器人指能自动运行任务的人造机器设备,用以取代或协助人类工作,一般会是机电设备,由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
《拥挤与受限环境下机器人集群协同控制》150页
专知会员服务
21+阅读 · 2025年5月4日
《人机团队背景下的受限集体运动研究》110页
专知会员服务
20+阅读 · 2025年4月9日
《无人智群及其社会融合》最新论文,中国工程院院刊
专知会员服务
28+阅读 · 2022年6月20日
专知会员服务
48+阅读 · 2020年12月8日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
【深度】行人检测算法
GAN生成式对抗网络
29+阅读 · 2018年6月3日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员