In this paper, we study the vehicle routing problem with a finite time horizon. In this routing problem, the objective is to maximize the number of customer requests served within a finite time horizon. We present a novel routing network embedding module which creates local node embedding vectors and a context-aware global graph representation. The proposed Markov decision process for the vehicle routing problem incorporates the node features, the network adjacency matrix and the edge features as components of the state space. We incorporate the remaining finite time horizon into the network embedding module to provide a proper routing context to the embedding module. We integrate our embedding module with a policy gradient-based deep Reinforcement Learning framework to solve the vehicle routing problem with finite time horizon. We trained and validated our proposed routing method on real-world routing networks, as well as synthetically generated Euclidean networks. Our experimental results show that our method achieves a higher customer service rate than the existing routing methods. Additionally, the solution time of our method is significantly lower than that of the existing methods.


翻译:本文研究有限时间范围内的车辆路径规划问题。在该路径规划问题中,目标是在有限时间范围内最大化已服务的客户请求数量。我们提出了一种新颖的路由网络嵌入模块,该模块可生成局部节点嵌入向量和上下文感知的全局图表示。针对车辆路径规划问题提出的马尔可夫决策过程,将节点特征、网络邻接矩阵和边特征作为状态空间的组成部分。我们将剩余有限时间范围纳入网络嵌入模块,为嵌入模块提供适当的路径规划上下文。我们将所提出的嵌入模块与基于策略梯度的深度强化学习框架相结合,以求解有限时间范围的车辆路径规划问题。我们在真实世界路由网络以及人工生成的欧几里得网络上对所提出的路由方法进行了训练和验证。实验结果表明,与现有路由方法相比,我们的方法实现了更高的客户服务率。此外,我们方法的求解时间显著低于现有方法。

0
下载
关闭预览

相关内容

基于强化学习的无人机自组网路由研究综述
专知会员服务
48+阅读 · 2023年9月9日
基于模型的强化学习综述
专知会员服务
48+阅读 · 2023年1月9日
深度学习在路由问题中的最新进展
专知会员服务
19+阅读 · 2022年3月6日
图节点嵌入(Node Embeddings)概述,9页pdf
专知
15+阅读 · 2020年8月22日
当深度强化学习遇见图神经网络
专知
227+阅读 · 2019年10月21日
车路协同应用场景分析
智能交通技术
24+阅读 · 2019年4月13日
PlaNet 简介:用于强化学习的深度规划网络
谷歌开发者
13+阅读 · 2019年3月16日
548页MIT强化学习教程,收藏备用【PDF下载】
机器学习算法与Python学习
17+阅读 · 2018年10月11日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
基于强化学习的无人机自组网路由研究综述
专知会员服务
48+阅读 · 2023年9月9日
基于模型的强化学习综述
专知会员服务
48+阅读 · 2023年1月9日
深度学习在路由问题中的最新进展
专知会员服务
19+阅读 · 2022年3月6日
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员