This study presents an emotion-aware navigation framework -- EmoBipedNav -- using deep reinforcement learning (DRL) for bipedal robots walking in socially interactive environments. The inherent locomotion constraints of bipedal robots challenge their safe maneuvering capabilities in dynamic environments. When combined with the intricacies of social environments, including pedestrian interactions and social cues, such as emotions, these challenges become even more pronounced. To address these coupled problems, we propose a two-stage pipeline that considers both bipedal locomotion constraints and complex social environments. Specifically, social navigation scenarios are represented using sequential LiDAR grid maps (LGMs), from which we extract latent features, including collision regions, emotion-related discomfort zones, social interactions, and the spatio-temporal dynamics of evolving environments. The extracted features are directly mapped to the actions of reduced-order models (ROMs) through a DRL architecture. Furthermore, the proposed framework incorporates full-order dynamics and locomotion constraints during training, effectively accounting for tracking errors and restrictions of the locomotion controller while planning the trajectory with ROMs. Comprehensive experiments demonstrate that our approach exceeds both model-based planners and DRL-based baselines. The hardware videos and open-source code are available at https://gatech-lidar.github.io/emobipednav.github.io/.


翻译:本研究提出了一种情感感知导航框架——EmoBipedNav,该框架利用深度强化学习(DRL)使双足机器人能够在社交互动环境中行走。双足机器人固有的运动约束对其在动态环境中的安全机动能力提出了挑战。当这些挑战与社交环境的复杂性(包括行人互动和情感等社交线索)相结合时,问题变得更加突出。为解决这些耦合问题,我们提出了一个两阶段流程,同时考虑了双足运动约束和复杂的社交环境。具体而言,我们使用序列化激光雷达网格地图(LGM)来表示社交导航场景,并从中提取潜在特征,包括碰撞区域、情感相关不适区、社交互动以及演化环境的时空动态。提取的特征通过DRL架构直接映射到降阶模型(ROM)的动作上。此外,所提出的框架在训练过程中结合了全阶动力学和运动约束,从而在利用ROM规划轨迹时,有效考虑了运动控制器的跟踪误差和限制。综合实验表明,我们的方法超越了基于模型的规划器和基于DRL的基线方法。硬件演示视频和开源代码可在 https://gatech-lidar.github.io/emobipednav.github.io/ 获取。

0
下载
关闭预览

相关内容

多智能体深度强化学习研究进展
专知会员服务
76+阅读 · 2024年7月17日
【剑桥大学博士论文】情感机器人的持续学习,270页pdf
专知会员服务
29+阅读 · 2023年5月6日
PlaNet 简介:用于强化学习的深度规划网络
谷歌开发者
13+阅读 · 2019年3月16日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
VIP会员
最新内容
乌军利用美国“黄蜂”无人机摧毁俄军后勤
专知会员服务
1+阅读 · 今天14:53
《支持作战级人机协同智能的交互式OODA流程》
专知会员服务
2+阅读 · 今天14:46
【伯克利博士论文】基于动作分块策略的强化学习
Transformer增强强化学习:通信网络基础与应用综述
ICML 2026 | SARDI:扩散语言模型的自增强检索
专知会员服务
6+阅读 · 6月6日
《国防领域安全采用大语言模型的战略蓝图》
专知会员服务
9+阅读 · 6月6日
ICML 2026 | 演化选择的因果建模
专知会员服务
10+阅读 · 6月5日
综述|学习式3D表征最新进展与趋势
专知会员服务
7+阅读 · 6月5日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员