Uncertainty-Aware Predictive Safety Filters for Probabilistic Neural Network Dynamics - 专知论文

会员服务 ·

0

滤波 · 概率 · 不确定 · 集成 · 不确定性 ·

Uncertainty-Aware Predictive Safety Filters for Probabilistic Neural Network Dynamics

翻译：不确定性感知预测安全滤波器用于概率性神经网络动力学

Bernd Frauenknecht,Lukas Kesper,Daniel Mayfrank,Henrik Hose,Sebastian Trimpe

Predictive safety filters (PSFs) leverage model predictive control to enforce constraint satisfaction during deep reinforcement learning (RL) exploration, yet their reliance on first-principles models or Gaussian processes limits scalability and broader applicability. Meanwhile, model-based RL (MBRL) methods routinely employ probabilistic ensemble (PE) neural networks to capture complex, high-dimensional dynamics from data with minimal prior knowledge. However, existing attempts to integrate PEs into PSFs lack rigorous uncertainty quantification. We introduce the Uncertainty-Aware Predictive Safety Filter (UPSi), a PSF that provides rigorous safety predictions using PE dynamics models by formulating future outcomes as reachable sets. UPSi introduces an explicit certainty constraint that prevents model exploitation and integrates seamlessly into common MBRL frameworks. We evaluate UPSi within Dyna-style MBRL on standard safe RL benchmarks and report substantial improvements in exploration safety over prior neural network PSFs while maintaining performance on par with standard MBRL. UPSi bridges the gap between the scalability and generality of modern MBRL and the safety guarantees of predictive safety filters.

翻译：预测安全滤波器（PSF）利用模型预测控制在深度强化学习探索过程中强制执行约束满足，但这类方法依赖第一性原理模型或高斯过程，限制了其可扩展性和更广泛适用性。与此同时，基于模型的强化学习（MBRL）方法通常采用概率集成神经网络，从数据中捕捉复杂高维动力学，且所需先验知识极少。然而，现有将概率集成模型整合到预测安全滤波器的尝试缺乏严格的量化不确定性分析。我们提出不确定性感知预测安全滤波器（UPSi），这是一种利用概率集成动力学模型通过将未来结果构建为可达集来提供严格安全预测的预测安全滤波器。UPSi引入显式的确定性约束，可防止模型过度利用，并无缝集成到常见MBRL框架中。我们在标准安全强化学习基准上对Dyna式MBRL中的UPSi进行评估，结果显示相较于先前的神经网络预测安全滤波器，该方法在探索安全性上取得显著提升，同时维持与标准MBRL相当的性能。UPSi弥合了现代MBRL的可扩展性与普适性同预测安全滤波器安全性保证之间的差距。

0

相关内容

《基于深度学习的软件定义网络模型用于物联网网络威胁检测》

《基于深度学习的软件定义网络模型用于物联网网络威胁检测》

专知会员服务

11+阅读 · 3月16日

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

专知会员服务

24+阅读 · 2025年8月14日

【斯坦福博士论文】概率机器学习中的不确定性原理

【斯坦福博士论文】概率机器学习中的不确定性原理

专知会员服务

27+阅读 · 2025年8月4日

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

专知会员服务

21+阅读 · 2025年6月24日

《图神经网络不确定性》最新综述

《图神经网络不确定性》最新综述

专知会员服务

28+阅读 · 2024年3月13日

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

专知会员服务

27+阅读 · 2024年2月1日

《实现网络防御态势感知能力的决策支持要素和使能技术》2023最新博士论文

《实现网络防御态势感知能力的决策支持要素和使能技术》2023最新博士论文

专知会员服务

41+阅读 · 2023年11月15日

《高级联合效能模型（AJEM）的不确定性量化和敏感性分析方法》美陆军30页报告：高级联合效应模型（AJEM）用于与威胁/目标交互的脆弱性和致命性（V/L）预测

《高级联合效能模型（AJEM）的不确定性量化和敏感性分析方法》美陆军30页报告：高级联合效应模型（AJEM）用于与威胁/目标交互的脆弱性和致命性（V/L）预测

专知会员服务

27+阅读 · 2023年7月5日

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

专知会员服务

24+阅读 · 2022年11月8日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

产业智能官

14+阅读 · 2019年5月5日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

网络安全态势感知

网络安全态势感知

计算机与网络安全

26+阅读 · 2018年10月14日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

【机器学习】【案例分析】基于机器学习的磁盘故障预测

【机器学习】【案例分析】基于机器学习的磁盘故障预测

产业智能官

12+阅读 · 2017年8月13日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

基于无线传感器网络的风电场在线监测和动态风速预测

国家自然科学基金

0+阅读 · 2015年12月31日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于子模优化的远程预警传感器管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于虚拟传感与故障机理的油气设备安全预测理论及模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于光源设计的微波光子滤波器及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

Safe Control using Learned Safety Filters and Adaptive Conformal Inference

Arxiv

0+阅读 · 4月20日

Nonlinear filtering based on density approximation and deep BSDE prediction

Arxiv

0+阅读 · 4月19日

Deep QP Safety Filter: Model-free Learning for Reachability-based Safety Filter

Arxiv

0+阅读 · 4月14日

SafeMind: A Risk-Aware Differentiable Control Framework for Adaptive and Safe Quadruped Locomotion

Arxiv

0+阅读 · 4月10日

SentinelSphere: Integrating AI-Powered Real-Time Threat Detection with Cybersecurity Awareness Training

Arxiv

0+阅读 · 4月8日

Safe learning-based control via function-based uncertainty quantification

Arxiv

0+阅读 · 4月1日

Energy Score-Guided Neural Gaussian Mixture Model for Predictive Uncertainty Quantification

Arxiv

0+阅读 · 3月29日

Towards Safe Learning-Based Non-Linear Model Predictive Control through Recurrent Neural Network Modeling

Arxiv

0+阅读 · 3月25日

A Real-Time Control Barrier Function-Based Safety Filter for Motion Planning with Arbitrary Road Boundary Constraints

Arxiv

0+阅读 · 3月24日

Uncertainty in Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2024年3月11日

VIP会员

文章信息

相关主题

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

4+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

2+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

2+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

3+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

4+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

3+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

《基于深度学习的软件定义网络模型用于物联网网络威胁检测》

《基于深度学习的软件定义网络模型用于物联网网络威胁检测》

专知会员服务

11+阅读 · 3月16日

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

专知会员服务

24+阅读 · 2025年8月14日

【斯坦福博士论文】概率机器学习中的不确定性原理

【斯坦福博士论文】概率机器学习中的不确定性原理

专知会员服务

27+阅读 · 2025年8月4日

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

《网络安全中的机器学习算法：网络防护与攻击检测》最新报告

专知会员服务

21+阅读 · 2025年6月24日

《图神经网络不确定性》最新综述

《图神经网络不确定性》最新综述

专知会员服务

28+阅读 · 2024年3月13日

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

专知会员服务

27+阅读 · 2024年2月1日

《实现网络防御态势感知能力的决策支持要素和使能技术》2023最新博士论文

《实现网络防御态势感知能力的决策支持要素和使能技术》2023最新博士论文

专知会员服务

41+阅读 · 2023年11月15日

《高级联合效能模型（AJEM）的不确定性量化和敏感性分析方法》美陆军30页报告：高级联合效应模型（AJEM）用于与威胁/目标交互的脆弱性和致命性（V/L）预测

《高级联合效能模型（AJEM）的不确定性量化和敏感性分析方法》美陆军30页报告：高级联合效应模型（AJEM）用于与威胁/目标交互的脆弱性和致命性（V/L）预测

专知会员服务

27+阅读 · 2023年7月5日

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

【NeurIPS2022】可解释机器学习的安全性:一种最大偏差方法

专知会员服务

24+阅读 · 2022年11月8日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

产业智能官

14+阅读 · 2019年5月5日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

网络安全态势感知

网络安全态势感知

计算机与网络安全

26+阅读 · 2018年10月14日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

【机器学习】【案例分析】基于机器学习的磁盘故障预测

【机器学习】【案例分析】基于机器学习的磁盘故障预测

产业智能官

12+阅读 · 2017年8月13日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

相关论文

Safe Control using Learned Safety Filters and Adaptive Conformal Inference

Arxiv

0+阅读 · 4月20日

Nonlinear filtering based on density approximation and deep BSDE prediction

Arxiv

0+阅读 · 4月19日

Deep QP Safety Filter: Model-free Learning for Reachability-based Safety Filter

Arxiv

0+阅读 · 4月14日

SafeMind: A Risk-Aware Differentiable Control Framework for Adaptive and Safe Quadruped Locomotion

Arxiv

0+阅读 · 4月10日

SentinelSphere: Integrating AI-Powered Real-Time Threat Detection with Cybersecurity Awareness Training

Arxiv

0+阅读 · 4月8日

Safe learning-based control via function-based uncertainty quantification

Arxiv

0+阅读 · 4月1日

Energy Score-Guided Neural Gaussian Mixture Model for Predictive Uncertainty Quantification

Arxiv

0+阅读 · 3月29日

Towards Safe Learning-Based Non-Linear Model Predictive Control through Recurrent Neural Network Modeling

Arxiv

0+阅读 · 3月25日

A Real-Time Control Barrier Function-Based Safety Filter for Motion Planning with Arbitrary Road Boundary Constraints

Arxiv

0+阅读 · 3月24日

Uncertainty in Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2024年3月11日

相关基金

基于无线传感器网络的风电场在线监测和动态风速预测

国家自然科学基金

0+阅读 · 2015年12月31日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于子模优化的远程预警传感器管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于虚拟传感与故障机理的油气设备安全预测理论及模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于光源设计的微波光子滤波器及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员