Balancing safety, efficiency, and operational costs in highway driving poses a challenging decision-making problem for heavy-duty vehicles. A central difficulty is that conventional scalar reward formulations, obtained by aggregating these competing objectives, often obscure the structure of their trade-offs. We present a Proximal Policy Optimization based multi-objective reinforcement learning framework that learns a continuous set of policies explicitly representing these trade-offs and evaluates it on a scalable simulation platform for tactical decision making in trucks. The proposed approach learns a continuous set of Pareto-optimal policies that capture the trade-offs among three conflicting objectives: safety, quantified in terms of collisions and successful completion; energy efficiency and time efficiency, quantified using energy cost and driver cost, respectively. The resulting Pareto frontier is smooth and interpretable, enabling flexibility in choosing driving behavior along different conflicting objectives. This framework allows seamless transitions between different driving policies without retraining, yielding a robust and adaptive decision-making strategy for autonomous trucking applications.


翻译:在高速公路驾驶中平衡安全性、效率与运营成本,对重型车辆构成了一项具有挑战性的决策问题。一个核心难点在于,通过聚合这些相互冲突的目标所得到的传统标量奖励函数,往往会模糊其权衡关系的结构。我们提出了一种基于近端策略优化的多目标强化学习框架,该框架学习一个明确表示这些权衡关系的连续策略集,并在一个可扩展的卡车战术决策仿真平台上对其进行了评估。所提出的方法学习到一个连续的帕累托最优策略集,该策略集捕捉了三个相互冲突目标之间的权衡:安全性(以碰撞次数和任务成功完成度量化)、能源效率以及时间效率(分别使用能源成本和驾驶员成本量化)。所得的帕累托前沿是平滑且可解释的,使得能够灵活地沿不同冲突目标选择驾驶行为。该框架允许在不同驾驶策略之间无缝切换而无需重新训练,从而为自动驾驶卡车应用提供了一种鲁棒且自适应的决策策略。

0
下载
关闭预览

相关内容

《基于分层多智能体强化学习的逼真空战协同策略》
专知会员服务
39+阅读 · 2025年10月30日
多智能体强化学习控制与决策研究综述
专知会员服务
46+阅读 · 2024年11月23日
自动驾驶中的多智能体强化学习综述
专知会员服务
47+阅读 · 2024年8月20日
《高超音速攻击中武器与目标分配的深度强化学习》
专知会员服务
57+阅读 · 2024年1月16日
基于多智能体强化学习的协同目标分配
专知会员服务
136+阅读 · 2023年9月5日
【CTH博士论文】基于强化学习的自动驾驶决策,149页pdf
专知会员服务
59+阅读 · 2023年2月18日
《多目标强化学习和规划的实用指南》59页最新论文
专知会员服务
55+阅读 · 2022年8月10日
「基于通信的多智能体强化学习」 进展综述
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
【MIT博士论文】数据高效强化学习,176页pdf
视频中的多目标跟踪【附PPT与视频资料】
人工智能前沿讲习班
30+阅读 · 2018年11月29日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
VIP会员
相关基金
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员