This study presents an Actor-Critic reinforcement learning Compensated Model Predictive Controller (AC2MPC) designed for high-speed, off-road autonomous driving on deformable terrains. Addressing the difficulty of modeling unknown tire-terrain interaction and ensuring real-time control feasibility and performance, this framework integrates deep reinforcement learning with a model predictive controller to manage unmodeled nonlinear dynamics. We evaluate the controller framework over constant and varying velocity profiles using high-fidelity simulator Project Chrono. Our findings demonstrate that our controller statistically outperforms standalone model-based and learning-based controllers over three unknown terrains that represent sandy deformable track, sandy and rocky track and cohesive clay-like deformable soil track. Despite varied and previously unseen terrain characteristics, this framework generalized well enough to track longitudinal reference speeds with the least error. Furthermore, this framework required significantly less training data compared to purely learning based controller, converging in fewer steps while delivering better performance. Even when under-trained, this controller outperformed the standalone controllers, highlighting its potential for safer and more efficient real-world deployment.


翻译:本研究提出了一种基于Actor-Critic强化学习的补偿模型预测控制器(AC2MPC),专为可变形地形上的高速越野自动驾驶设计。针对未知轮胎-地形相互作用建模困难以及实时控制可行性与性能保障的挑战,该框架将深度强化学习与模型预测控制器相结合,以处理未建模的非线性动力学。我们使用高保真仿真器Project Chrono,在恒定与变化的速度曲线下对该控制器框架进行评估。实验结果表明,在代表沙质可变形路径、沙石混合路径以及黏性类黏土可变形土壤路径的三种未知地形上,我们的控制器在统计意义上优于独立的基于模型的控制器与基于学习的控制器。尽管面对多样且先前未见的地形特征,该框架仍展现出良好的泛化能力,能以最小误差跟踪纵向参考速度。此外,与纯学习型控制器相比,该框架所需的训练数据显著减少,收敛步数更少且性能更优。即使在训练不足的情况下,该控制器仍优于独立控制器,突显了其在现实世界中更安全、更高效部署的潜力。

0
下载
关闭预览

相关内容

《2对2超视距空战机动问题的强化学习方法》最新126页
专知会员服务
102+阅读 · 2025年3月11日
LargeAD:面向自动驾驶的大规模跨传感器数据预训练
专知会员服务
17+阅读 · 2025年1月8日
「强化学习在无人车领域」的应用与展望
专知会员服务
58+阅读 · 2022年12月8日
深度预测学习:模型与应用
专知会员服务
49+阅读 · 2022年12月5日
专知会员服务
140+阅读 · 2021年2月17日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
176+阅读 · 2020年2月8日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
深度学习技术在自动驾驶中的应用
智能交通技术
26+阅读 · 2019年10月27日
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
TensorFlow 2.0深度强化学习指南
云栖社区
18+阅读 · 2019年2月1日
李克强:智能车辆运动控制研究综述
厚势
21+阅读 · 2017年10月17日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员