We introduce Deep QP Safety Filter, a fully data-driven safety layer for black-box dynamical systems. Our method learns a Quadratic-Program (QP) safety filter without model knowledge by combining Hamilton-Jacobi (HJ) reachability with model-free learning. We construct contraction-based losses for both the safety value and its derivatives, and train two neural networks accordingly. In the exact setting, the learned critic converges to the viscosity solution (and its derivative), even for non-smooth values. Across diverse dynamical systems -- even including a hybrid system -- and multiple RL tasks, Deep QP Safety Filter substantially reduces pre-convergence failures while accelerating learning toward higher returns than strong baselines, offering a principled and practical route to safe, model-free control.


翻译:本文提出深度 QP 安全过滤器,一种用于黑盒动力系统的完全数据驱动的安全层。我们的方法通过将 Hamilton-Jacobi (HJ) 可达性与无模型学习相结合,在无需模型知识的情况下学习一个二次规划 (QP) 安全过滤器。我们为安全值及其导数构建了基于收缩的损失函数,并相应地训练两个神经网络。在精确设定下,即使对于非光滑值,学习到的评价器也能收敛到粘性解(及其导数)。在多种动力系统(甚至包括混合系统)和多个强化学习任务中,深度 QP 安全过滤器显著减少了收敛前的失败,同时比强基线更快地学习到更高的回报,为安全、无模型的控制提供了一条原则性且实用的路径。

0
下载
关闭预览

相关内容

基于深度学习的入侵检测系统:综述
专知会员服务
15+阅读 · 2025年4月11日
《可解释深度强化学习综述》
专知会员服务
40+阅读 · 2025年2月12日
【普林斯顿博士论文】深度学习安全性,275页pdf
专知会员服务
66+阅读 · 2023年2月9日
深度学习可解释性研究进展
专知
19+阅读 · 2020年6月26日
推荐召回算法之深度召回模型串讲
AINLP
22+阅读 · 2019年6月14日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
深度学习目标检测模型全面综述:Faster R-CNN、R-FCN和SSD
深度学习世界
10+阅读 · 2017年9月18日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
基于深度学习的入侵检测系统:综述
专知会员服务
15+阅读 · 2025年4月11日
《可解释深度强化学习综述》
专知会员服务
40+阅读 · 2025年2月12日
【普林斯顿博士论文】深度学习安全性,275页pdf
专知会员服务
66+阅读 · 2023年2月9日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员