鲁棒神经李雅普诺夫-屏障证书的形式化综合 (Formal Synthesis of Certifiably Robust Neural Lyapunov-Barrier Certificates) - 专知论文

会员服务 ·

0

鲁棒 · 扰动 · 形式化 · Lipschitz · 系统 ·

Formal Synthesis of Certifiably Robust Neural Lyapunov-Barrier Certificates

翻译：鲁棒神经李雅普诺夫-屏障证书的形式化综合

Chengxiao Wang,Haoze Wu,Gagandeep Singh

Neural Lyapunov and barrier certificates have recently been used as powerful tools for verifying the safety and stability properties of deep reinforcement learning (RL) controllers. However, existing methods offer guarantees only under fixed ideal unperturbed dynamics, limiting their reliability in real-world applications where dynamics may deviate due to uncertainties. In this work, we study the problem of synthesizing \emph{robust neural Lyapunov barrier certificates} that maintain their guarantees under perturbations in system dynamics. We formally define a robust Lyapunov barrier function and specify sufficient conditions based on Lipschitz continuity that ensure robustness against bounded perturbations. We propose practical training objectives that enforce these conditions via adversarial training, Lipschitz neighborhood bound, and global Lipschitz regularization. We validate our approach in two practically relevant environments, Inverted Pendulum and 2D Docking. The former is a widely studied benchmark, while the latter is a safety-critical task in autonomous systems. We show that our methods significantly improve both certified robustness bounds (up to $4.6$ times) and empirical success rates under strong perturbations (up to $2.4$ times) compared to the baseline. Our results demonstrate effectiveness of training robust neural certificates for safe RL under perturbations in dynamics.

翻译：神经李雅普诺夫与屏障证书近来已成为验证深度强化学习控制器安全性与稳定性属性的有力工具。然而，现有方法仅在固定、理想、无扰动的动力学模型下提供保证，这限制了其在现实世界应用中的可靠性，因为实际动力学可能因不确定性而发生偏离。在本工作中，我们研究了综合**鲁棒神经李雅普诺夫屏障证书**的问题，该证书能在系统动力学存在扰动的情况下维持其保证。我们形式化地定义了鲁棒李雅普诺夫屏障函数，并基于Lipschitz连续性指定了确保对有限扰动具有鲁棒性的充分条件。我们提出了实用的训练目标，通过对抗训练、Lipschitz邻域边界和全局Lipschitz正则化来强制执行这些条件。我们在两个具有实际相关性的环境中验证了我们的方法：倒立摆和二维对接。前者是一个被广泛研究的基准，而后者是自主系统中的一项安全关键任务。实验表明，与基线方法相比，我们的方法在强扰动下显著提升了认证鲁棒性边界（高达$4.6$倍）和经验成功率（高达$2.4$倍）。我们的结果证明了在动力学存在扰动的情况下，训练鲁棒神经证书对于安全强化学习的有效性。

0

相关内容

【ETHZ博士论文】人工智能的鲁棒性和公平性的正式和统计认证

【ETHZ博士论文】人工智能的鲁棒性和公平性的正式和统计认证

专知会员服务

27+阅读 · 2024年10月11日

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

专知会员服务

15+阅读 · 2024年10月9日

【ETHZ博士论文】认证神经网络的表达能力，86页pdf

【ETHZ博士论文】认证神经网络的表达能力，86页pdf

专知会员服务

20+阅读 · 2024年6月16日

【牛津大学博士论文】图神经网络鲁棒机器学习，173页pdf

【牛津大学博士论文】图神经网络鲁棒机器学习，173页pdf

专知会员服务

28+阅读 · 2024年5月15日

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

专知会员服务

47+阅读 · 2023年6月18日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知会员服务

48+阅读 · 2022年11月4日

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

专知会员服务

25+阅读 · 2022年11月2日

【NeurIPS 2020】耶鲁大学等提出「AdaBelief」的新型优化器，速度快，训练稳，泛化强

专知会员服务

18+阅读 · 2020年10月19日

【开放新书】可验证深度学习，91页pdf阐述Deep Learning的鲁棒性，提升安全可靠性

【开放新书】可验证深度学习，91页pdf阐述Deep Learning的鲁棒性，提升安全可靠性

专知会员服务

59+阅读 · 2020年4月11日

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

专知会员服务

13+阅读 · 2019年11月25日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

用PyTorch实现的李沐《动手学深度学习》，登上GitHub热榜，获得700+星

用PyTorch实现的李沐《动手学深度学习》，登上GitHub热榜，获得700+星

量子位

13+阅读 · 2019年9月10日

资源 | 复旦大学邱锡鹏教授发布《神经网络与深度学习》教材，配备代码和章节练习

资源 | 复旦大学邱锡鹏教授发布《神经网络与深度学习》教材，配备代码和章节练习

AI科技评论

12+阅读 · 2019年4月12日

【干货】33页最新《自然语言处理中神经注意力机制综述》论文

【干货】33页最新《自然语言处理中神经注意力机制综述》论文

专知

31+阅读 · 2019年2月10日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

亚马逊首席科学家MXNet作者李沐开讲: 伯克利2019深度学习课程，不可错过

亚马逊首席科学家MXNet作者李沐开讲: 伯克利2019深度学习课程，不可错过

专知

12+阅读 · 2018年12月23日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

资源 | 《深度强化学习》手稿开放了！

资源 | 《深度强化学习》手稿开放了！

机器之心

21+阅读 · 2018年10月17日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

78+阅读 · 2018年8月7日

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

专知

17+阅读 · 2018年4月28日

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

新型神经炎症保护剂先导化合物的快速发现及构效关系研究

国家自然科学基金

0+阅读 · 2015年12月31日

光遗传学技术应用于研究上丘相关皮层下神经环路对本能防御行为的调控

国家自然科学基金

0+阅读 · 2015年12月31日

基于离散化Lyapunov-Krasovskii泛函方法的时滞Markov跳变系统分析与综合

国家自然科学基金

0+阅读 · 2015年12月31日

递质剥夺诱导纹状体神经环路及其突触损害机制的实验证实

国家自然科学基金

0+阅读 · 2014年12月31日

学习与记忆的神经动力学研究

国家自然科学基金

1+阅读 · 2014年12月31日

适用于模拟神经突触功能的电阻可渐变调控忆阻器及其机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

非凸非光滑优化的神经网络设计及其关键问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

Lyapunov Spectral Analysis of Speech Embedding Trajectories in Psychosis

Arxiv

0+阅读 · 2月18日

Tracking Finite-Time Lyapunov Exponents to Robustify Neural ODEs

Arxiv

0+阅读 · 2月10日

Algebraic Robustness Verification of Neural Networks

Arxiv

0+阅读 · 2月5日

Towards X-embodiment safety: A control theory perspective on transferring safety certificates across dynamical systems

Arxiv

0+阅读 · 2月3日

MSACL: Multi-Step Actor-Critic Learning with Lyapunov Certificates for Exponentially Stabilizing Control

Arxiv

0+阅读 · 2月3日

PoSafeNet: Safe Learning with Poset-Structured Neural Nets

Arxiv

0+阅读 · 1月29日

Reinforcement Learning Goal-Reaching Control with Guaranteed Lyapunov-Like Stabilizer for Mobile Robots

Arxiv

0+阅读 · 1月27日

NeuroShield: A Neuro-Symbolic Framework for Adversarial Robustness

Arxiv

0+阅读 · 1月19日

Off Policy Lyapunov Stability in Reinforcement Learning

Arxiv

0+阅读 · 1月16日

Barrier Certificates for Unknown Systems with Latent States and Polynomial Dynamics using Bayesian Inference

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

相关VIP内容

【ETHZ博士论文】人工智能的鲁棒性和公平性的正式和统计认证

【ETHZ博士论文】人工智能的鲁棒性和公平性的正式和统计认证

专知会员服务

27+阅读 · 2024年10月11日

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

专知会员服务

15+阅读 · 2024年10月9日

【ETHZ博士论文】认证神经网络的表达能力，86页pdf

【ETHZ博士论文】认证神经网络的表达能力，86页pdf

专知会员服务

20+阅读 · 2024年6月16日

【牛津大学博士论文】图神经网络鲁棒机器学习，173页pdf

【牛津大学博士论文】图神经网络鲁棒机器学习，173页pdf

专知会员服务

28+阅读 · 2024年5月15日

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

专知会员服务

47+阅读 · 2023年6月18日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知会员服务

48+阅读 · 2022年11月4日

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

专知会员服务

25+阅读 · 2022年11月2日

【NeurIPS 2020】耶鲁大学等提出「AdaBelief」的新型优化器，速度快，训练稳，泛化强

专知会员服务

18+阅读 · 2020年10月19日

【开放新书】可验证深度学习，91页pdf阐述Deep Learning的鲁棒性，提升安全可靠性

【开放新书】可验证深度学习，91页pdf阐述Deep Learning的鲁棒性，提升安全可靠性

专知会员服务

59+阅读 · 2020年4月11日

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

专知会员服务

13+阅读 · 2019年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

用PyTorch实现的李沐《动手学深度学习》，登上GitHub热榜，获得700+星

用PyTorch实现的李沐《动手学深度学习》，登上GitHub热榜，获得700+星

量子位

13+阅读 · 2019年9月10日

资源 | 复旦大学邱锡鹏教授发布《神经网络与深度学习》教材，配备代码和章节练习

资源 | 复旦大学邱锡鹏教授发布《神经网络与深度学习》教材，配备代码和章节练习

AI科技评论

12+阅读 · 2019年4月12日

【干货】33页最新《自然语言处理中神经注意力机制综述》论文

【干货】33页最新《自然语言处理中神经注意力机制综述》论文

专知

31+阅读 · 2019年2月10日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

亚马逊首席科学家MXNet作者李沐开讲: 伯克利2019深度学习课程，不可错过

亚马逊首席科学家MXNet作者李沐开讲: 伯克利2019深度学习课程，不可错过

专知

12+阅读 · 2018年12月23日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

资源 | 《深度强化学习》手稿开放了！

资源 | 《深度强化学习》手稿开放了！

机器之心

21+阅读 · 2018年10月17日

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

【下载】深度强化学习实战书籍和代码《Deep Reinforcement Learning in Action》

专知

78+阅读 · 2018年8月7日

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

专知

17+阅读 · 2018年4月28日

相关论文

Lyapunov Spectral Analysis of Speech Embedding Trajectories in Psychosis

Arxiv

0+阅读 · 2月18日

Tracking Finite-Time Lyapunov Exponents to Robustify Neural ODEs

Arxiv

0+阅读 · 2月10日

Algebraic Robustness Verification of Neural Networks

Arxiv

0+阅读 · 2月5日

Towards X-embodiment safety: A control theory perspective on transferring safety certificates across dynamical systems

Arxiv

0+阅读 · 2月3日

MSACL: Multi-Step Actor-Critic Learning with Lyapunov Certificates for Exponentially Stabilizing Control

Arxiv

0+阅读 · 2月3日

PoSafeNet: Safe Learning with Poset-Structured Neural Nets

Arxiv

0+阅读 · 1月29日

Reinforcement Learning Goal-Reaching Control with Guaranteed Lyapunov-Like Stabilizer for Mobile Robots

Arxiv

0+阅读 · 1月27日

NeuroShield: A Neuro-Symbolic Framework for Adversarial Robustness

Arxiv

0+阅读 · 1月19日

Off Policy Lyapunov Stability in Reinforcement Learning

Arxiv

0+阅读 · 1月16日

Barrier Certificates for Unknown Systems with Latent States and Polynomial Dynamics using Bayesian Inference

Arxiv

0+阅读 · 1月15日

相关基金

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

新型神经炎症保护剂先导化合物的快速发现及构效关系研究

国家自然科学基金

0+阅读 · 2015年12月31日

光遗传学技术应用于研究上丘相关皮层下神经环路对本能防御行为的调控

国家自然科学基金

0+阅读 · 2015年12月31日

基于离散化Lyapunov-Krasovskii泛函方法的时滞Markov跳变系统分析与综合

国家自然科学基金

0+阅读 · 2015年12月31日

递质剥夺诱导纹状体神经环路及其突触损害机制的实验证实

国家自然科学基金

0+阅读 · 2014年12月31日

学习与记忆的神经动力学研究

国家自然科学基金

1+阅读 · 2014年12月31日

适用于模拟神经突触功能的电阻可渐变调控忆阻器及其机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

非凸非光滑优化的神经网络设计及其关键问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员