A unifying Bayesian framework for adversarial robustness - 专知论文

会员服务 ·

0

MoDELS · 稳健性 · Machine Learning · Learning · 评论员 ·

A unifying Bayesian framework for adversarial robustness

翻译：暂无翻译

Pablo G. Arce,Roi Naveiro,David Ríos Insua

The vulnerability of machine learning models to adversarial attacks remains a critical societal security challenge. Traditional defenses, such as adversarial training, typically robustify models by minimizing a worst-case loss. These deterministic approaches do not account for uncertainty in the adversary's attack. While stochastic defenses placing a probability distribution on the adversary exist, they often lack statistical rigor and fail to make explicit their underlying assumptions. To resolve these issues, we introduce a formal Bayesian framework that models adversarial uncertainty through a stochastic channel, articulating all probabilistic assumptions. This yields two robustification strategies: a proactive defense enacted during training, aligned with adversarial training, and a reactive defense enacted during operations, aligned with adversarial purification. Several state-of-the-art defenses can be recovered as limiting cases of our model. We empirically validate our methodology, showcasing the benefits of explicitly modeling adversarial uncertainty.

翻译：暂无翻译

0

相关内容

MoDELS

ACM/IEEE第23届模型驱动工程语言和系统国际会议，是模型驱动软件和系统工程的首要会议系列，由ACM-SIGSOFT和IEEE-TCSE支持组织。自1998年以来，模型涵盖了建模的各个方面，从语言和方法到工具和应用程序。模特的参加者来自不同的背景，包括研究人员、学者、工程师和工业专业人士。MODELS 2019是一个论坛，参与者可以围绕建模和模型驱动的软件和系统交流前沿研究成果和创新实践经验。今年的版本将为建模社区提供进一步推进建模基础的机会，并在网络物理系统、嵌入式系统、社会技术系统、云计算、大数据、机器学习、安全、开源等新兴领域提出建模的创新应用以及可持续性。官网链接：http://www.modelsconference.org/

《生成式人工智能军事应用安全保障：弹性可信部署框架》2025最新50页slides

《生成式人工智能军事应用安全保障：弹性可信部署框架》2025最新50页slides

专知会员服务

26+阅读 · 2025年11月21日

AAAI2025｜TrustUQA：统一结构化数据问答的可信框架

AAAI2025｜TrustUQA：统一结构化数据问答的可信框架

专知会员服务

20+阅读 · 2024年12月20日

【布朗大学David Abel博士论文】A Theory of Abstraction in Reinforcement Learning

【布朗大学David Abel博士论文】A Theory of Abstraction in Reinforcement Learning

专知会员服务

25+阅读 · 2022年3月16日

生成式对抗网络先验贝叶斯推断，Bayesian Inference with Generative Adversarial Network Priors

生成式对抗网络先验贝叶斯推断，Bayesian Inference with Generative Adversarial Network Priors

专知会员服务

28+阅读 · 2020年2月18日

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

专知会员服务

12+阅读 · 2020年1月13日

【KDD2019|讲座推荐】深层贝叶斯挖掘、学习与理解：Deep Bayesian Mining, Learning and Understanding

【KDD2019|讲座推荐】深层贝叶斯挖掘、学习与理解：Deep Bayesian Mining, Learning and Understanding

专知会员服务

65+阅读 · 2019年12月14日

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

专知会员服务

35+阅读 · 2019年11月30日

【AAAI 2019 Tutorial】对抗机器学习（Adversarial Machine Learning），Bo Li，Dawn Song，Yevgeniy Vorobeychik

【AAAI 2019 Tutorial】对抗机器学习（Adversarial Machine Learning），Bo Li，Dawn Song，Yevgeniy Vorobeychik

专知会员服务

29+阅读 · 2019年11月18日

Stabilizing Transformers for Reinforcement Learning

Stabilizing Transformers for Reinforcement Learning

专知会员服务

61+阅读 · 2019年10月17日

【ICML2019 tutorial】安全机器学习（Safe Machine Learning），Silvia Chiappa，Jan Leike

【ICML2019 tutorial】安全机器学习（Safe Machine Learning），Silvia Chiappa，Jan Leike

专知会员服务

23+阅读 · 2019年6月10日

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

专知

31+阅读 · 2022年4月19日

联邦学习研究综述

联邦学习研究综述

专知

11+阅读 · 2021年12月25日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

【AAAI2019教程】面向隐私安全保密的联邦学习与迁移学习，101页pdf

【AAAI2019教程】面向隐私安全保密的联邦学习与迁移学习，101页pdf

专知

47+阅读 · 2019年1月29日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

44+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

AI前线

12+阅读 · 2018年5月13日

NIPS 2017：贝叶斯深度学习与深度贝叶斯学习（讲义+视频）

NIPS 2017：贝叶斯深度学习与深度贝叶斯学习（讲义+视频）

机器学习研究会

36+阅读 · 2017年12月10日

动态重构综合模块化航空电子系统适航安全性评估方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

考虑具有风险结构的决策建模及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

12+阅读 · 2008年12月31日

Discovering Latent Groups for Robust Classification

Arxiv

0+阅读 · 6月22日

FairBED: A Bayesian Experimental Design Approach to Gathering Fairer Data

Arxiv

0+阅读 · 6月22日

BayesFP: Posterior Estimation for Flow-Based Policies via Feynman-Kac Sampling

Arxiv

0+阅读 · 6月19日

A Human-in-the-Loop Bayesian Optimization Framework for Constraint-Aware Bioprocess Development

Arxiv

0+阅读 · 6月17日

Calibrated Sampling-Free Uncertainty Estimation in Bayesian Deep Learning

Arxiv

0+阅读 · 6月17日

BCL: Bayesian In-Context Learning Framework for Information Extraction

Arxiv

0+阅读 · 6月17日

Bayesian perspectives on exponential random graph models

Arxiv

0+阅读 · 5月25日

Bayesian Deep Learning for Graphs

Arxiv

23+阅读 · 2022年2月24日

Composite Adversarial Attacks

Arxiv

12+阅读 · 2020年12月10日

Feature Denoising for Improving Adversarial Robustness

Feature Denoising for Improving Adversarial Robustness

Arxiv

15+阅读 · 2018年12月9日

VIP会员

文章信息

相关主题

Machine Learning

最新内容

综述 | Weights or Skills?：机器人学习从动作预测权重到自编写技能

综述 | Weights or Skills?：机器人学习从动作预测权重到自编写技能

专知会员服务

0+阅读 · 2分钟前

面向2027年及未来的海军情报改革

面向2027年及未来的海军情报改革

专知会员服务

3+阅读 · 8月5日

透视一体化防空：人工智能如何重构从探测到杀伤的靶向全流程

透视一体化防空：人工智能如何重构从探测到杀伤的靶向全流程

专知会员服务

6+阅读 · 8月5日

《多武器毁伤效能评估：解析解与优化瞄准点研究》

《多武器毁伤效能评估：解析解与优化瞄准点研究》

专知会员服务

6+阅读 · 8月5日

《一种面向不确定作战环境的异构无人机协同任务与航路规划随机多目标优化方法》

《一种面向不确定作战环境的异构无人机协同任务与航路规划随机多目标优化方法》

专知会员服务

7+阅读 · 8月5日

《一种基于博弈论的海军平台动态武器分配问题求解方法》

《一种基于博弈论的海军平台动态武器分配问题求解方法》

专知会员服务

5+阅读 · 8月5日

《一种面向武器目标分配的快速可扩展Transformer-指针强化学习框架》

《一种面向武器目标分配的快速可扩展Transformer-指针强化学习框架》

专知会员服务

7+阅读 · 8月5日

ACM MM 2026 | DualG-MRAG：解耦宏观推理与微观匹配的多模态检索增强生成

ACM MM 2026 | DualG-MRAG：解耦宏观推理与微观匹配的多模态检索增强生成

专知会员服务

5+阅读 · 8月5日

综述 | Self-Evolving Coding Agents：自进化编程智能体

综述 | Self-Evolving Coding Agents：自进化编程智能体

专知会员服务

6+阅读 · 8月5日

战火淬炼创新：美军联合战备训练中心探讨现代战场挑战

战火淬炼创新：美军联合战备训练中心探讨现代战场挑战

专知会员服务

5+阅读 · 8月5日

美海军陆战队将三型无人机整合入统一战场网络

美海军陆战队将三型无人机整合入统一战场网络

专知会员服务

3+阅读 · 8月5日

《战术指挥控制要务：构建韧性机动指挥控制网格》美智库报告

《战术指挥控制要务：构建韧性机动指挥控制网格》美智库报告

专知会员服务

5+阅读 · 8月5日

《无人机蜂群：释放人类-蜂群编队的潜能》

《无人机蜂群：释放人类-蜂群编队的潜能》

专知会员服务

6+阅读 · 8月5日

《战略战术化：一项综合性述评》

《战略战术化：一项综合性述评》

专知会员服务

4+阅读 · 8月5日

基于竞争性多智能体强化学习的携网无人机高机动目标拦截研究

基于竞争性多智能体强化学习的携网无人机高机动目标拦截研究

专知会员服务

6+阅读 · 8月5日

相关VIP内容

《生成式人工智能军事应用安全保障：弹性可信部署框架》2025最新50页slides

《生成式人工智能军事应用安全保障：弹性可信部署框架》2025最新50页slides

专知会员服务

26+阅读 · 2025年11月21日

AAAI2025｜TrustUQA：统一结构化数据问答的可信框架

AAAI2025｜TrustUQA：统一结构化数据问答的可信框架

专知会员服务

20+阅读 · 2024年12月20日

【布朗大学David Abel博士论文】A Theory of Abstraction in Reinforcement Learning

【布朗大学David Abel博士论文】A Theory of Abstraction in Reinforcement Learning

专知会员服务

25+阅读 · 2022年3月16日

生成式对抗网络先验贝叶斯推断，Bayesian Inference with Generative Adversarial Network Priors

生成式对抗网络先验贝叶斯推断，Bayesian Inference with Generative Adversarial Network Priors

专知会员服务

28+阅读 · 2020年2月18日

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

专知会员服务

12+阅读 · 2020年1月13日

【KDD2019|讲座推荐】深层贝叶斯挖掘、学习与理解：Deep Bayesian Mining, Learning and Understanding

【KDD2019|讲座推荐】深层贝叶斯挖掘、学习与理解：Deep Bayesian Mining, Learning and Understanding

专知会员服务

65+阅读 · 2019年12月14日

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

专知会员服务

35+阅读 · 2019年11月30日

【AAAI 2019 Tutorial】对抗机器学习（Adversarial Machine Learning），Bo Li，Dawn Song，Yevgeniy Vorobeychik

【AAAI 2019 Tutorial】对抗机器学习（Adversarial Machine Learning），Bo Li，Dawn Song，Yevgeniy Vorobeychik

专知会员服务

29+阅读 · 2019年11月18日

Stabilizing Transformers for Reinforcement Learning

Stabilizing Transformers for Reinforcement Learning

专知会员服务

61+阅读 · 2019年10月17日

【ICML2019 tutorial】安全机器学习（Safe Machine Learning），Silvia Chiappa，Jan Leike

【ICML2019 tutorial】安全机器学习（Safe Machine Learning），Silvia Chiappa，Jan Leike

专知会员服务

23+阅读 · 2019年6月10日

热门VIP内容

开通专知VIP会员享更多权益服务

透视一体化防空：人工智能如何重构从探测到杀伤的靶向全流程

《一种面向不确定作战环境的异构无人机协同任务与航路规划随机多目标优化方法》

面向2027年及未来的海军情报改革

《多武器毁伤效能评估：解析解与优化瞄准点研究》

相关资讯

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

专知

31+阅读 · 2022年4月19日

联邦学习研究综述

联邦学习研究综述

专知

11+阅读 · 2021年12月25日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

【AAAI2019教程】面向隐私安全保密的联邦学习与迁移学习，101页pdf

【AAAI2019教程】面向隐私安全保密的联邦学习与迁移学习，101页pdf

专知

47+阅读 · 2019年1月29日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

44+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

CVPR 2018 | 伯克利等提出无监督特征学习新方法，代码已开源

AI前线

12+阅读 · 2018年5月13日

NIPS 2017：贝叶斯深度学习与深度贝叶斯学习（讲义+视频）

NIPS 2017：贝叶斯深度学习与深度贝叶斯学习（讲义+视频）

机器学习研究会

36+阅读 · 2017年12月10日

相关论文

Discovering Latent Groups for Robust Classification

Arxiv

0+阅读 · 6月22日

FairBED: A Bayesian Experimental Design Approach to Gathering Fairer Data

Arxiv

0+阅读 · 6月22日

BayesFP: Posterior Estimation for Flow-Based Policies via Feynman-Kac Sampling

Arxiv

0+阅读 · 6月19日

A Human-in-the-Loop Bayesian Optimization Framework for Constraint-Aware Bioprocess Development

Arxiv

0+阅读 · 6月17日

Calibrated Sampling-Free Uncertainty Estimation in Bayesian Deep Learning

Arxiv

0+阅读 · 6月17日

BCL: Bayesian In-Context Learning Framework for Information Extraction

Arxiv

0+阅读 · 6月17日

Bayesian perspectives on exponential random graph models

Arxiv

0+阅读 · 5月25日

Bayesian Deep Learning for Graphs

Arxiv

23+阅读 · 2022年2月24日

Composite Adversarial Attacks

Arxiv

12+阅读 · 2020年12月10日

Feature Denoising for Improving Adversarial Robustness

Feature Denoising for Improving Adversarial Robustness

Arxiv

15+阅读 · 2018年12月9日

相关基金

动态重构综合模块化航空电子系统适航安全性评估方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

考虑具有风险结构的决策建模及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

12+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员