分层强化学习在城市系统中空地协同配送的应用 (Hierarchical Reinforcement Learning for Cooperative Air-Ground Delivery in Urban System) - 专知论文

会员服务 ·

0

分层 · 协同 · 空地协同 · 系统 · 分层强化学习 ·

Hierarchical Reinforcement Learning for Cooperative Air-Ground Delivery in Urban System

翻译：分层强化学习在城市系统中空地协同配送的应用

Songxin Lei,Chunming Ma,Haomin Wen,Yexin Li,Lizhenghe Chen,Qianyu Yang,Fugee Tsung,Lei Chen,Sijie Ruan,Yuxuan Liang

Cooperative air-ground delivery has emerged as a promising logistics paradigm by leveraging the complementary strengths of UAVs and ground carriers. However, effective dispatching in such heterogeneous systems faces two critical challenges: i) the heterogeneity between flight and road dynamics, ii) the scalability bottleneck raised by the exponential decision variables in large-scale fleets. To address these challenges, we propose HRL4AG, a Hierarchical Reinforcement Learning framework for cooperative Air-Ground delivery. Specifically, HRL4AG employs a high-level manager to tackle the scalability bottleneck by decomposing the joint action space, and mode-specific workers that encode distinct flight and road dynamics to address the heterogeneity. Furthermore, a novel internal reward mechanism is designed to guide the hierarchical policy learning, addressing the credit assignment problem in sparse-reward settings. Extensive experiments on two real-world datasets and an evaluation platform demonstrate that HRL4AG significantly outperforms state-of-the-art baselines, improving the delivery success rate by up to 26% while achieving an 80-fold increase in computational efficiency.

翻译：空地协同配送通过利用无人机与地面载具的互补优势，已成为一种前景广阔的物流范式。然而，在此类异构系统中实现高效调度面临两大关键挑战：i) 飞行与地面行驶动态特性的异质性；ii) 大规模车队中决策变量指数级增长带来的可扩展性瓶颈。为应对这些挑战，我们提出HRL4AG——一种用于空地协同配送的分层强化学习框架。具体而言，HRL4AG采用高层管理器通过分解联合动作空间来解决可扩展性瓶颈，并利用编码不同飞行与地面动态特性的模式专用工作者来处理异质性问题。此外，我们设计了一种新颖的内部奖励机制来指导分层策略学习，以解决稀疏奖励环境中的信用分配问题。在两个真实数据集和评估平台上进行的广泛实验表明，HRL4AG显著优于现有先进基线方法，在实现计算效率80倍提升的同时，将配送成功率最高提升26%。

0

相关内容

《共享代理、意图一致性与分布式智能：协同空战的科学框架》最新40页报告

《共享代理、意图一致性与分布式智能：协同空战的科学框架》最新40页报告

专知会员服务

31+阅读 · 2月10日

《基于分层多智能体强化学习的逼真空战协同策略》

《基于分层多智能体强化学习的逼真空战协同策略》

专知会员服务

38+阅读 · 2025年10月30日

《空天地一体化网络资源分配与用户关联策略分析》最新综述

《空天地一体化网络资源分配与用户关联策略分析》最新综述

专知会员服务

19+阅读 · 2025年9月21日

《多无人机作战分层强化学习框架》

《多无人机作战分层强化学习框架》

专知会员服务

32+阅读 · 2025年2月21日

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

专知会员服务

66+阅读 · 2024年11月19日

空地协同无人系统研究

空地协同无人系统研究

专知会员服务

66+阅读 · 2024年11月3日

《分析强化学习智能体在空战中的能力：综合性能评估工具》

《分析强化学习智能体在空战中的能力：综合性能评估工具》

专知会员服务

73+阅读 · 2024年7月10日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

66+阅读 · 2023年10月5日

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

专知会员服务

49+阅读 · 2022年11月15日

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

专知会员服务

65+阅读 · 2019年8月8日

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

专知

28+阅读 · 2022年10月22日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

52+阅读 · 2022年10月6日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

105+阅读 · 2022年4月28日

高精地图在车路协同中的应用

高精地图在车路协同中的应用

智能交通技术

10+阅读 · 2019年7月11日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

20+阅读 · 2019年6月9日

车路协同应用场景分析

车路协同应用场景分析

智能交通技术

24+阅读 · 2019年4月13日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【前沿跟进】Google, OpenAI提出层次强化学习新思路

【前沿跟进】Google, OpenAI提出层次强化学习新思路

CreateAMind

13+阅读 · 2018年5月31日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

基于两层协调结构的空分供气网络调控方法

国家自然科学基金

0+阅读 · 2017年12月31日

数据驱动的航空运输系统多层结构及韧性研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于多自主体的集装箱多式联运协调与协同优化研究

国家自然科学基金

3+阅读 · 2015年12月31日

运用协同分布估计算法优化交通调度问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

空时协作定位的信息机理及算法设计

国家自然科学基金

0+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

基于神经网络和强化学习的车辆装配系统中的多载量小车实时调度方法

国家自然科学基金

4+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

Dual-Quadruped Collaborative Transportation in Narrow Environments via Safe Reinforcement Learning

Arxiv

0+阅读 · 2月18日

ORCHID: Fairness-Aware Orchestration in Mission-Critical Air-Ground Integrated Networks

Arxiv

0+阅读 · 2月10日

Federated Hierarchical Reinforcement Learning for Adaptive Traffic Signal Control

Arxiv

0+阅读 · 2月7日

Coupled Local and Global World Models for Efficient First Order RL

Arxiv

0+阅读 · 2月5日

Device Association and Resource Allocation for Hierarchical Split Federated Learning in Space-Air-Ground Integrated Network

Arxiv

0+阅读 · 2月5日

Parameterized Algorithms for the Drone Delivery Problem

Arxiv

0+阅读 · 2月4日

Device Association and Resource Allocation for Hierarchical Split Federated Learning in Space-Air-Ground Integrated Network

Arxiv

0+阅读 · 2月4日

Multiconnectivity for SAGIN: Current Trends, Challenges, AI-driven Solutions, and Opportunities

Arxiv

0+阅读 · 1月25日

Communication-Free Collective Navigation for a Swarm of UAVs via LiDAR-Based Deep Reinforcement Learning

Arxiv

0+阅读 · 1月20日

Cooperative UAVs for Remote Data Collection under Limited Communications: An Asynchronous Multiagent Learning Framework

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

分层强化学习

相关VIP内容

《共享代理、意图一致性与分布式智能：协同空战的科学框架》最新40页报告

《共享代理、意图一致性与分布式智能：协同空战的科学框架》最新40页报告

专知会员服务

31+阅读 · 2月10日

《基于分层多智能体强化学习的逼真空战协同策略》

《基于分层多智能体强化学习的逼真空战协同策略》

专知会员服务

38+阅读 · 2025年10月30日

《空天地一体化网络资源分配与用户关联策略分析》最新综述

《空天地一体化网络资源分配与用户关联策略分析》最新综述

专知会员服务

19+阅读 · 2025年9月21日

《多无人机作战分层强化学习框架》

《多无人机作战分层强化学习框架》

专知会员服务

32+阅读 · 2025年2月21日

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

专知会员服务

66+阅读 · 2024年11月19日

空地协同无人系统研究

空地协同无人系统研究

专知会员服务

66+阅读 · 2024年11月3日

《分析强化学习智能体在空战中的能力：综合性能评估工具》

《分析强化学习智能体在空战中的能力：综合性能评估工具》

专知会员服务

73+阅读 · 2024年7月10日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

66+阅读 · 2023年10月5日

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

专知会员服务

49+阅读 · 2022年11月15日

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

专知会员服务

65+阅读 · 2019年8月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

专知

28+阅读 · 2022年10月22日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

52+阅读 · 2022年10月6日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

105+阅读 · 2022年4月28日

高精地图在车路协同中的应用

高精地图在车路协同中的应用

智能交通技术

10+阅读 · 2019年7月11日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

20+阅读 · 2019年6月9日

车路协同应用场景分析

车路协同应用场景分析

智能交通技术

24+阅读 · 2019年4月13日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【前沿跟进】Google, OpenAI提出层次强化学习新思路

【前沿跟进】Google, OpenAI提出层次强化学习新思路

CreateAMind

13+阅读 · 2018年5月31日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Dual-Quadruped Collaborative Transportation in Narrow Environments via Safe Reinforcement Learning

Arxiv

0+阅读 · 2月18日

ORCHID: Fairness-Aware Orchestration in Mission-Critical Air-Ground Integrated Networks

Arxiv

0+阅读 · 2月10日

Federated Hierarchical Reinforcement Learning for Adaptive Traffic Signal Control

Arxiv

0+阅读 · 2月7日

Coupled Local and Global World Models for Efficient First Order RL

Arxiv

0+阅读 · 2月5日

Device Association and Resource Allocation for Hierarchical Split Federated Learning in Space-Air-Ground Integrated Network

Arxiv

0+阅读 · 2月5日

Parameterized Algorithms for the Drone Delivery Problem

Arxiv

0+阅读 · 2月4日

Device Association and Resource Allocation for Hierarchical Split Federated Learning in Space-Air-Ground Integrated Network

Arxiv

0+阅读 · 2月4日

Multiconnectivity for SAGIN: Current Trends, Challenges, AI-driven Solutions, and Opportunities

Arxiv

0+阅读 · 1月25日

Communication-Free Collective Navigation for a Swarm of UAVs via LiDAR-Based Deep Reinforcement Learning

Arxiv

0+阅读 · 1月20日

Cooperative UAVs for Remote Data Collection under Limited Communications: An Asynchronous Multiagent Learning Framework

Arxiv

0+阅读 · 1月15日

相关基金

基于两层协调结构的空分供气网络调控方法

国家自然科学基金

0+阅读 · 2017年12月31日

数据驱动的航空运输系统多层结构及韧性研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于多自主体的集装箱多式联运协调与协同优化研究

国家自然科学基金

3+阅读 · 2015年12月31日

运用协同分布估计算法优化交通调度问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

空时协作定位的信息机理及算法设计

国家自然科学基金

0+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

基于神经网络和强化学习的车辆装配系统中的多载量小车实时调度方法

国家自然科学基金

4+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员