Safe Control using Learned Safety Filters and Adaptive Conformal Inference - 专知论文

会员服务 ·

0

自适应 · 共形 · 推断 · 安全控制 · 系统 ·

Safe Control using Learned Safety Filters and Adaptive Conformal Inference

翻译：基于学习的安全过滤器与自适应共形推断的受控安全控制

Sacha Huriot,Ihab Tabbara,Hussein Sibai

from arxiv, Accepted to L4DC 2026

Safety filters have been shown to be effective tools to ensure the safety of control systems with unsafe nominal policies. To address scalability challenges in traditional synthesis methods, learning-based approaches have been proposed for designing safety filters for systems with high-dimensional state and control spaces. However, the inevitable errors in the decisions of these models raise concerns about their reliability and the safety guarantees they offer. This paper presents Adaptive Conformal Filtering (ACoFi), a method that combines learned Hamilton-Jacobi reachability-based safety filters with adaptive conformal inference. Under ACoFi, the filter dynamically adjusts its switching criteria based on the observed errors in its predictions of the safety of actions. The range of possible safety values of the nominal policy's output is used to quantify uncertainty in safety assessment. The filter switches from the nominal policy to the learned safe one when that range suggests it might be unsafe. We show that ACoFi guarantees that the rate of incorrectly quantifying uncertainty in the predicted safety of the nominal policy is asymptotically upper bounded by a user-defined parameter. This gives a soft safety guarantee rather than a hard safety guarantee. We evaluate ACoFi in a Dubins car simulation and a Safety Gymnasium environment, empirically demonstrating that it significantly outperforms the baseline method that uses a fixed switching threshold by achieving higher learned safety values and fewer safety violations, especially in out-of-distribution scenarios.

翻译：安全过滤器已被证明是确保采用不安全标称策略的控制系统安全性的有效工具。为应对传统合成方法中的可扩展性挑战，研究者提出了基于学习的方法来为具有高维状态和控制空间的系统设计安全过滤器。然而，这些模型决策中的必然误差引发了对其可靠性及所提供安全保证的担忧。本文提出自适应共形过滤（ACoFi）方法，它将基于学习的Hamilton-Jacobi可达性安全过滤器与自适应共形推断相结合。在ACoFi机制下，过滤器会根据其对动作安全性预测中观测到的误差动态调整切换准则。通过标称策略输出可能的安全值范围来量化安全评估中的不确定性。当该范围表明标称策略可能不安全时，过滤器会从标称策略切换至学习到的安全策略。我们证明ACoFi能确保对标称策略预测安全性进行不确定性量化的错误率在渐近意义上被用户定义参数上界约束。这提供了软安全保证而非硬安全保证。我们在Dubins车辆仿真和Safety Gymnasium环境中评估了ACoFi，实验证明其通过实现更高的学习安全值和更少的安全违规，显著优于使用固定切换阈值的基线方法，尤其在分布外场景中表现突出。

0

相关内容

自适应

【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合

【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合

专知会员服务

14+阅读 · 2025年10月25日

图学习隐私与安全问题研究综述

图学习隐私与安全问题研究综述

专知会员服务

31+阅读 · 2023年6月11日

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

专知会员服务

29+阅读 · 2023年4月23日

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”（Assured Autonomy）项目技术报告，2022年8月

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”（Assured Autonomy）项目技术报告，2022年8月

专知会员服务

41+阅读 · 2022年9月25日

深度强化学习的攻防与安全性分析综述

深度强化学习的攻防与安全性分析综述

专知会员服务

27+阅读 · 2022年1月16日

面向网络空间防御的对抗机器学习研究综述

专知会员服务

36+阅读 · 2021年8月13日

机器学习的安全问题及隐私保护

专知会员服务

40+阅读 · 2020年12月20日

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

专知会员服务

52+阅读 · 2020年12月12日

机器学习模型安全与隐私研究综述

机器学习模型安全与隐私研究综述

专知会员服务

115+阅读 · 2020年11月12日

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

专知会员服务

36+阅读 · 2020年3月19日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

【2022新书】网络安全的博弈论与机器学习，547页pdf

【2022新书】网络安全的博弈论与机器学习，547页pdf

专知

14+阅读 · 2022年8月12日

《机器学习技术及其在国防和安全中的应用》加拿大国防部发布（海上探测和监视、对抗ML），76页pdf

《机器学习技术及其在国防和安全中的应用》加拿大国防部发布（海上探测和监视、对抗ML），76页pdf

专知

26+阅读 · 2022年4月1日

「强化学习可解释性」最新2022综述

「强化学习可解释性」最新2022综述

专知

12+阅读 · 2022年1月16日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【论文笔记】注意力机制的协同过滤模型 Attentive Collaborative Filtering(ACF)

【论文笔记】注意力机制的协同过滤模型 Attentive Collaborative Filtering(ACF)

专知

50+阅读 · 2019年9月23日

【智能金融】机器学习在反欺诈中应用

【智能金融】机器学习在反欺诈中应用

产业智能官

35+阅读 · 2019年3月15日

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

产业智能官

49+阅读 · 2018年7月4日

深度学习应用于网络空间安全所面临的十大问题与机遇

深度学习应用于网络空间安全所面临的十大问题与机遇

计算机研究与发展

22+阅读 · 2018年6月7日

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

面向主动安全控制的工程车辆动态信息获取与状态辨识

国家自然科学基金

0+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络化控制系统安全理论与关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

Learning Discriminators for Resampling in the Ensemble Gaussian Mixture Filter through a Normalizing Flow Approach

Arxiv

0+阅读 · 5月1日

Uncertainty-Aware Predictive Safety Filters for Probabilistic Neural Network Dynamics

Arxiv

0+阅读 · 4月29日

Exploiting Differential Flatness for Efficient Learning-based Model Predictive Control of Constrained Multi-Input Control Affine Systems

Arxiv

0+阅读 · 4月27日

Towards Adaptive, Learning-Based Security in Decentralized Applications

Arxiv

0+阅读 · 4月16日

Learning-Based vs Human-Derived Congestion Control: An In-Depth Experimental Study

Arxiv

0+阅读 · 4月15日

Hierarchical Reinforcement Learning with Runtime Safety Shielding for Power Grid Operation

Arxiv

0+阅读 · 4月15日

Deep QP Safety Filter: Model-free Learning for Reachability-based Safety Filter

Arxiv

0+阅读 · 4月14日

SafeMind: A Risk-Aware Differentiable Control Framework for Adaptive and Safe Quadruped Locomotion

Arxiv

0+阅读 · 4月10日

Constraint-Aware Reinforcement Learning via Adaptive Action Scaling

Arxiv

0+阅读 · 4月2日

Safe learning-based control via function-based uncertainty quantification

Arxiv

0+阅读 · 4月1日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合

【普林斯顿博士论文】面向人本机器人学的安全与学习博弈论融合

专知会员服务

14+阅读 · 2025年10月25日

图学习隐私与安全问题研究综述

图学习隐私与安全问题研究综述

专知会员服务

31+阅读 · 2023年6月11日

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

专知会员服务

29+阅读 · 2023年4月23日

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”（Assured Autonomy）项目技术报告，2022年8月

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”（Assured Autonomy）项目技术报告，2022年8月

专知会员服务

41+阅读 · 2022年9月25日

深度强化学习的攻防与安全性分析综述

深度强化学习的攻防与安全性分析综述

专知会员服务

27+阅读 · 2022年1月16日

面向网络空间防御的对抗机器学习研究综述

专知会员服务

36+阅读 · 2021年8月13日

机器学习的安全问题及隐私保护

专知会员服务

40+阅读 · 2020年12月20日

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

专知会员服务

52+阅读 · 2020年12月12日

机器学习模型安全与隐私研究综述

机器学习模型安全与隐私研究综述

专知会员服务

115+阅读 · 2020年11月12日

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

专知会员服务

36+阅读 · 2020年3月19日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

【2022新书】网络安全的博弈论与机器学习，547页pdf

【2022新书】网络安全的博弈论与机器学习，547页pdf

专知

14+阅读 · 2022年8月12日

《机器学习技术及其在国防和安全中的应用》加拿大国防部发布（海上探测和监视、对抗ML），76页pdf

《机器学习技术及其在国防和安全中的应用》加拿大国防部发布（海上探测和监视、对抗ML），76页pdf

专知

26+阅读 · 2022年4月1日

「强化学习可解释性」最新2022综述

「强化学习可解释性」最新2022综述

专知

12+阅读 · 2022年1月16日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【论文笔记】注意力机制的协同过滤模型 Attentive Collaborative Filtering(ACF)

【论文笔记】注意力机制的协同过滤模型 Attentive Collaborative Filtering(ACF)

专知

50+阅读 · 2019年9月23日

【智能金融】机器学习在反欺诈中应用

【智能金融】机器学习在反欺诈中应用

产业智能官

35+阅读 · 2019年3月15日

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

产业智能官

49+阅读 · 2018年7月4日

深度学习应用于网络空间安全所面临的十大问题与机遇

深度学习应用于网络空间安全所面临的十大问题与机遇

计算机研究与发展

22+阅读 · 2018年6月7日

相关论文

Learning Discriminators for Resampling in the Ensemble Gaussian Mixture Filter through a Normalizing Flow Approach

Arxiv

0+阅读 · 5月1日

Uncertainty-Aware Predictive Safety Filters for Probabilistic Neural Network Dynamics

Arxiv

0+阅读 · 4月29日

Exploiting Differential Flatness for Efficient Learning-based Model Predictive Control of Constrained Multi-Input Control Affine Systems

Arxiv

0+阅读 · 4月27日

Towards Adaptive, Learning-Based Security in Decentralized Applications

Arxiv

0+阅读 · 4月16日

Learning-Based vs Human-Derived Congestion Control: An In-Depth Experimental Study

Arxiv

0+阅读 · 4月15日

Hierarchical Reinforcement Learning with Runtime Safety Shielding for Power Grid Operation

Arxiv

0+阅读 · 4月15日

Deep QP Safety Filter: Model-free Learning for Reachability-based Safety Filter

Arxiv

0+阅读 · 4月14日

SafeMind: A Risk-Aware Differentiable Control Framework for Adaptive and Safe Quadruped Locomotion

Arxiv

0+阅读 · 4月10日

Constraint-Aware Reinforcement Learning via Adaptive Action Scaling

Arxiv

0+阅读 · 4月2日

Safe learning-based control via function-based uncertainty quantification

Arxiv

0+阅读 · 4月1日

相关基金

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

面向主动安全控制的工程车辆动态信息获取与状态辨识

国家自然科学基金

0+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络化控制系统安全理论与关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

基于博弈论的信息安全理论与方法研究

国家自然科学基金

10+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员