Interacting safely with cyclists using Hamilton-Jacobi reachability and reinforcement learning - 专知论文

会员服务 ·

0

交互 · 交互方法 · 行者 · 度量 · 强化学习 ·

Interacting safely with cyclists using Hamilton-Jacobi reachability and reinforcement learning

翻译：基于哈密顿-雅可比可达性与强化学习的自行车安全交互方法

Aarati Andrea Noronha,Jean Oh

from arxiv, 7 pages. This manuscript was completed in 2020 as part of the first author's graduate thesis at Carnegie Mellon University

In this paper, we present a framework for enabling autonomous vehicles to interact with cyclists in a manner that balances safety and optimality. The approach integrates Hamilton-Jacobi reachability analysis with deep Q-learning to jointly address safety guarantees and time-efficient navigation. A value function is computed as the solution to a time-dependent Hamilton-Jacobi-Bellman inequality, providing a quantitative measure of safety for each system state. This safety metric is incorporated as a structured reward signal within a reinforcement learning framework. The method further models the cyclist's latent response to the vehicle, allowing disturbance inputs to reflect human comfort and behavioral adaptation. The proposed framework is evaluated through simulation and comparison with human driving behavior and an existing state-of-the-art method.

翻译：本文提出一种使自动驾驶车辆能够以兼顾安全性与最优性的方式与自行车骑行者进行交互的框架。该方法将哈密顿-雅可比可达性分析与深度Q学习相结合，以协同处理安全保证与时间效率优化问题。通过求解时变哈密顿-雅可比-贝尔曼不等式得到值函数，为每个系统状态提供安全性的量化度量。该安全度量作为结构化奖励信号被整合到强化学习框架中。该方法进一步建模了骑行者对车辆的潜在响应，使扰动输入能够反映人类舒适度与行为适应性。通过仿真实验，并与人类驾驶行为及现有先进方法进行对比，对所提框架进行了评估。

0

相关内容

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

专知会员服务

12+阅读 · 2月25日

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

专知会员服务

34+阅读 · 2024年10月10日

【CMU博士论文】面向可部署的强化学习：安全性、鲁棒性、适应性和可扩展性

【CMU博士论文】面向可部署的强化学习：安全性、鲁棒性、适应性和可扩展性

专知会员服务

41+阅读 · 2024年4月23日

【CTH博士论文】基于强化学习的自动驾驶决策，149页pdf

【CTH博士论文】基于强化学习的自动驾驶决策，149页pdf

专知会员服务

60+阅读 · 2023年2月18日

【普林斯顿博士论文】动力系统的安全强化学习与约束学习，245页pdf

【普林斯顿博士论文】动力系统的安全强化学习与约束学习，245页pdf

专知会员服务

42+阅读 · 2023年2月2日

「强化学习在无人车领域」的应用与展望

「强化学习在无人车领域」的应用与展望

专知会员服务

60+阅读 · 2022年12月8日

MIT最新论文《在有信号的交叉路口学习生态驾驶策略》：利用人工智能帮助自动驾驶车辆避免在红灯前空转

MIT最新论文《在有信号的交叉路口学习生态驾驶策略》：利用人工智能帮助自动驾驶车辆避免在红灯前空转

专知会员服务

22+阅读 · 2022年5月21日

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

专知会员服务

35+阅读 · 2022年5月6日

强化学习的自动驾驶控制技术研究进展

专知会员服务

141+阅读 · 2021年2月17日

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

专知会员服务

16+阅读 · 2019年10月3日

「强化学习可解释性」最新2022综述

「强化学习可解释性」最新2022综述

专知

12+阅读 · 2022年1月16日

深度学习可解释性研究进展

深度学习可解释性研究进展

专知

19+阅读 · 2020年6月26日

深度学习技术在自动驾驶中的应用

深度学习技术在自动驾驶中的应用

智能交通技术

26+阅读 · 2019年10月27日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

专知

22+阅读 · 2018年12月17日

548页MIT强化学习教程，收藏备用【PDF下载】

548页MIT强化学习教程，收藏备用【PDF下载】

机器学习算法与Python学习

17+阅读 · 2018年10月11日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

78+阅读 · 2018年8月7日

基于计算机视觉的自动驾驶算法研究综述 | 厚势

基于计算机视觉的自动驾驶算法研究综述 | 厚势

厚势

10+阅读 · 2018年2月8日

李克强：智能车辆运动控制研究综述

李克强：智能车辆运动控制研究综述

厚势

21+阅读 · 2017年10月17日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

进近条件下社交感知航空自组网安全态势可靠共享方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大功率柔顺驱动器的设计方法及能量优化和交互安全机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

驾驶行为与交通安全状态交互作用机理研究

国家自然科学基金

2+阅读 · 2014年12月31日

电动汽车与可再生能源的时空耦合特性及能量调度和容量配置的协同进化方法

国家自然科学基金

1+阅读 · 2014年12月31日

融入驾驶人感知的交通流建模方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

混入自动驾驶汽车的高速公路交通流微观建模与仿真方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

Learning Robust Markov Models for Safe Runtime Monitoring

Arxiv

0+阅读 · 2月16日

Composable Model-Free RL for Navigation with Input-Affine Systems

Arxiv

0+阅读 · 2月13日

Aligning Microscopic Vehicle and Macroscopic Traffic Statistics: Reconstructing Driving Behavior from Partial Data

Arxiv

0+阅读 · 2月9日

Federated Hierarchical Reinforcement Learning for Adaptive Traffic Signal Control

Arxiv

0+阅读 · 2月7日

HyPlan: Hybrid Learning-Assisted Planning Under Uncertainty for Safe Autonomous Driving

Arxiv

0+阅读 · 2月6日

Transformer-Based Reinforcement Learning for Autonomous Orbital Collision Avoidance in Partially Observable Environments

Arxiv

0+阅读 · 2月5日

Modelling Pedestrian Behaviour in Autonomous Vehicle Encounters Using Naturalistic Dataset

Arxiv

0+阅读 · 2月4日

Safe Urban Traffic Control via Uncertainty-Aware Conformal Prediction and World-Model Reinforcement Learning

Arxiv

0+阅读 · 2月4日

Conformal Reachability for Safe Control in Unknown Environments

Conformal Reachability for Safe Control in Unknown Environments

Arxiv

0+阅读 · 2月3日

Aligning Microscopic Vehicle and Macroscopic Traffic Statistics: Reconstructing Driving Behavior from Partial Data

Arxiv

0+阅读 · 1月29日

VIP会员

文章信息

相关主题

最新内容

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

8+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

3+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

4+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

3+阅读 · 7月22日

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

15+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

11+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

9+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

7+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

9+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

8+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

10+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

9+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

10+阅读 · 7月20日

相关VIP内容

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

专知会员服务

12+阅读 · 2月25日

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

专知会员服务

34+阅读 · 2024年10月10日

【CMU博士论文】面向可部署的强化学习：安全性、鲁棒性、适应性和可扩展性

【CMU博士论文】面向可部署的强化学习：安全性、鲁棒性、适应性和可扩展性

专知会员服务

41+阅读 · 2024年4月23日

【CTH博士论文】基于强化学习的自动驾驶决策，149页pdf

【CTH博士论文】基于强化学习的自动驾驶决策，149页pdf

专知会员服务

60+阅读 · 2023年2月18日

【普林斯顿博士论文】动力系统的安全强化学习与约束学习，245页pdf

【普林斯顿博士论文】动力系统的安全强化学习与约束学习，245页pdf

专知会员服务

42+阅读 · 2023年2月2日

「强化学习在无人车领域」的应用与展望

「强化学习在无人车领域」的应用与展望

专知会员服务

60+阅读 · 2022年12月8日

MIT最新论文《在有信号的交叉路口学习生态驾驶策略》：利用人工智能帮助自动驾驶车辆避免在红灯前空转

MIT最新论文《在有信号的交叉路口学习生态驾驶策略》：利用人工智能帮助自动驾驶车辆避免在红灯前空转

专知会员服务

22+阅读 · 2022年5月21日

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

专知会员服务

35+阅读 · 2022年5月6日

强化学习的自动驾驶控制技术研究进展

专知会员服务

141+阅读 · 2021年2月17日

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

【强化学习研讨会|Microsoft Research】安全公平的机器学习（Safe and Fair Machine Learning）

专知会员服务

16+阅读 · 2019年10月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

对抗环境下超视距目标打击的情报支援

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

相关资讯

「强化学习可解释性」最新2022综述

「强化学习可解释性」最新2022综述

专知

12+阅读 · 2022年1月16日

深度学习可解释性研究进展

深度学习可解释性研究进展

专知

19+阅读 · 2020年6月26日

深度学习技术在自动驾驶中的应用

深度学习技术在自动驾驶中的应用

智能交通技术

26+阅读 · 2019年10月27日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)

专知

22+阅读 · 2018年12月17日

548页MIT强化学习教程，收藏备用【PDF下载】

548页MIT强化学习教程，收藏备用【PDF下载】

机器学习算法与Python学习

17+阅读 · 2018年10月11日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

78+阅读 · 2018年8月7日

基于计算机视觉的自动驾驶算法研究综述 | 厚势

基于计算机视觉的自动驾驶算法研究综述 | 厚势

厚势

10+阅读 · 2018年2月8日

李克强：智能车辆运动控制研究综述

李克强：智能车辆运动控制研究综述

厚势

21+阅读 · 2017年10月17日

相关论文

Learning Robust Markov Models for Safe Runtime Monitoring

Arxiv

0+阅读 · 2月16日

Composable Model-Free RL for Navigation with Input-Affine Systems

Arxiv

0+阅读 · 2月13日

Aligning Microscopic Vehicle and Macroscopic Traffic Statistics: Reconstructing Driving Behavior from Partial Data

Arxiv

0+阅读 · 2月9日

Federated Hierarchical Reinforcement Learning for Adaptive Traffic Signal Control

Arxiv

0+阅读 · 2月7日

HyPlan: Hybrid Learning-Assisted Planning Under Uncertainty for Safe Autonomous Driving

Arxiv

0+阅读 · 2月6日

Transformer-Based Reinforcement Learning for Autonomous Orbital Collision Avoidance in Partially Observable Environments

Arxiv

0+阅读 · 2月5日

Modelling Pedestrian Behaviour in Autonomous Vehicle Encounters Using Naturalistic Dataset

Arxiv

0+阅读 · 2月4日

Safe Urban Traffic Control via Uncertainty-Aware Conformal Prediction and World-Model Reinforcement Learning

Arxiv

0+阅读 · 2月4日

Conformal Reachability for Safe Control in Unknown Environments

Conformal Reachability for Safe Control in Unknown Environments

Arxiv

0+阅读 · 2月3日

Aligning Microscopic Vehicle and Macroscopic Traffic Statistics: Reconstructing Driving Behavior from Partial Data

Arxiv

0+阅读 · 1月29日

相关基金

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

进近条件下社交感知航空自组网安全态势可靠共享方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大功率柔顺驱动器的设计方法及能量优化和交互安全机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

驾驶行为与交通安全状态交互作用机理研究

国家自然科学基金

2+阅读 · 2014年12月31日

电动汽车与可再生能源的时空耦合特性及能量调度和容量配置的协同进化方法

国家自然科学基金

1+阅读 · 2014年12月31日

融入驾驶人感知的交通流建模方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

混入自动驾驶汽车的高速公路交通流微观建模与仿真方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员