CausAdv: A Causal-based Framework for Detecting Adversarial Examples - 专知论文

会员服务 ·

0

对抗 · 样本 · 对抗样本 · 对抗样本检测 · 因果推理 ·

CausAdv: A Causal-based Framework for Detecting Adversarial Examples

翻译：CausAdv：一种基于因果推理的对抗样本检测框架

Deep learning has led to tremendous success in computer vision, largely due to Convolutional Neural Networks (CNNs). However, CNNs have been shown to be vulnerable to crafted adversarial perturbations. This vulnerability of adversarial examples has has motivated research into improving model robustness through adversarial detection and defense methods. In this paper, we address the adversarial robustness of CNNs through causal reasoning. We propose CausAdv: a causal framework for detecting adversarial examples based on counterfactual reasoning. CausAdv learns both causal and non-causal features of every input, and quantifies the counterfactual information (CI) of every filter of the last convolutional layer. We then perform a statistical analysis of the filters' CI across clean and adversarial samples, to demonstrate that adversarial examples exhibit different CI distributions compared to clean samples. Our results show that causal reasoning enhances the process of adversarial detection without the need to train a separate detector. Moreover, we illustrate the efficiency of causal explanations as a helpful detection tool by visualizing the extracted causal features.

翻译：深度学习在计算机视觉领域取得了巨大成功，这主要归功于卷积神经网络（CNNs）。然而，研究表明，CNNs容易受到精心设计的对抗性扰动的攻击。对抗样本的这种脆弱性促使了通过对抗检测与防御方法来提升模型鲁棒性的研究。本文通过因果推理来解决CNNs的对抗鲁棒性问题。我们提出了CausAdv：一种基于反事实推理的对抗样本检测因果框架。CausAdv学习每个输入的因果特征与非因果特征，并对最后一个卷积层中每个滤波器的反事实信息（CI）进行量化。随后，我们对干净样本与对抗样本之间滤波器的CI进行统计分析，以证明对抗样本与干净样本相比呈现出不同的CI分布。我们的结果表明，因果推理能够增强对抗检测的过程，而无需训练单独的检测器。此外，我们通过可视化提取的因果特征，阐明了因果解释作为一种有效检测工具的效率。

0

相关内容

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

专知会员服务

34+阅读 · 2022年11月25日

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

专知会员服务

32+阅读 · 2022年11月7日

面向图像数据的对抗样本检测与防御技术综述

面向图像数据的对抗样本检测与防御技术综述

专知会员服务

48+阅读 · 2022年6月27日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

对抗样本生成技术综述

对抗样本生成技术综述

专知会员服务

67+阅读 · 2020年7月21日

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

专知会员服务

63+阅读 · 2020年4月19日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知会员服务

80+阅读 · 2020年3月13日

【综述】基于图的对抗式攻击和防御，附22页论文下载

【综述】基于图的对抗式攻击和防御，附22页论文下载

专知会员服务

69+阅读 · 2020年3月5日

【浙江大学】对抗样本生成技术综述

【浙江大学】对抗样本生成技术综述

专知会员服务

92+阅读 · 2020年1月6日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

专知会员服务

49+阅读 · 2019年11月21日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

SemanticAdv：基于语义属性的对抗样本生成方法

SemanticAdv：基于语义属性的对抗样本生成方法

机器之心

14+阅读 · 2019年7月12日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

【学界】基于条件深度卷积生成对抗网络的图像识别方法

【学界】基于条件深度卷积生成对抗网络的图像识别方法

GAN生成式对抗网络

16+阅读 · 2018年7月26日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于免疫机制的无线传感器网络攻击协同检测研究与设计

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率本体的CPS入侵检测方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

CausalArmor: Efficient Indirect Prompt Injection Guardrails via Causal Attribution

Arxiv

0+阅读 · 2月8日

CausalCompass: Evaluating the Robustness of Time-Series Causal Discovery in Misspecified Scenarios

Arxiv

0+阅读 · 2月8日

CausalTAD: Injecting Causal Knowledge into Large Language Models for Tabular Anomaly Detection

Arxiv

0+阅读 · 2月8日

Exploring Adversarial Watermarking in Transformer-Based Models: Transferability and Robustness Against Defense Mechanism for Medical Images

Arxiv

0+阅读 · 2月7日

Multi-AD: Cross-Domain Unsupervised Anomaly Detection for Medical and Industrial Applications

Arxiv

0+阅读 · 2月5日

Contrastive Spectral Rectification: Test-Time Defense towards Zero-shot Adversarial Robustness of CLIP

Arxiv

0+阅读 · 1月27日

Sy-FAR: Symmetry-based Fair Adversarial Robustness

Arxiv

0+阅读 · 1月19日

CausalSpatial: A Benchmark for Object-Centric Causal Spatial Reasoning

Arxiv

0+阅读 · 1月19日

NeuroShield: A Neuro-Symbolic Framework for Adversarial Robustness

Arxiv

0+阅读 · 1月19日

An analytic theory of convolutional neural network inverse problems solvers

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

对抗样本检测

最新内容

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

1+阅读 · 今天15:03

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

2+阅读 · 今天14:33

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

1+阅读 · 今天14:08

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

1+阅读 · 今天13:55

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

2+阅读 · 今天13:53

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

0+阅读 · 今天13:42

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

0+阅读 · 今天13:46

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

0+阅读 · 今天13:43

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

1+阅读 · 今天13:17

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

10+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

9+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

8+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

14+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

7+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

9+阅读 · 4月18日

相关VIP内容

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

专知会员服务

34+阅读 · 2022年11月25日

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

专知会员服务

32+阅读 · 2022年11月7日

面向图像数据的对抗样本检测与防御技术综述

面向图像数据的对抗样本检测与防御技术综述

专知会员服务

48+阅读 · 2022年6月27日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

对抗样本生成技术综述

对抗样本生成技术综述

专知会员服务

67+阅读 · 2020年7月21日

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

专知会员服务

63+阅读 · 2020年4月19日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知会员服务

80+阅读 · 2020年3月13日

【综述】基于图的对抗式攻击和防御，附22页论文下载

【综述】基于图的对抗式攻击和防御，附22页论文下载

专知会员服务

69+阅读 · 2020年3月5日

【浙江大学】对抗样本生成技术综述

【浙江大学】对抗样本生成技术综述

专知会员服务

92+阅读 · 2020年1月6日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

专知会员服务

49+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《高超音速武器：一项再度兴起的技术》120页slides

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

美国当前高超音速导弹发展概述

无人机蜂群建模与仿真方法

相关资讯

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

SemanticAdv：基于语义属性的对抗样本生成方法

SemanticAdv：基于语义属性的对抗样本生成方法

机器之心

14+阅读 · 2019年7月12日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

【学界】基于条件深度卷积生成对抗网络的图像识别方法

【学界】基于条件深度卷积生成对抗网络的图像识别方法

GAN生成式对抗网络

16+阅读 · 2018年7月26日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

相关论文

CausalArmor: Efficient Indirect Prompt Injection Guardrails via Causal Attribution

Arxiv

0+阅读 · 2月8日

CausalCompass: Evaluating the Robustness of Time-Series Causal Discovery in Misspecified Scenarios

Arxiv

0+阅读 · 2月8日

CausalTAD: Injecting Causal Knowledge into Large Language Models for Tabular Anomaly Detection

Arxiv

0+阅读 · 2月8日

Exploring Adversarial Watermarking in Transformer-Based Models: Transferability and Robustness Against Defense Mechanism for Medical Images

Arxiv

0+阅读 · 2月7日

Multi-AD: Cross-Domain Unsupervised Anomaly Detection for Medical and Industrial Applications

Arxiv

0+阅读 · 2月5日

Contrastive Spectral Rectification: Test-Time Defense towards Zero-shot Adversarial Robustness of CLIP

Arxiv

0+阅读 · 1月27日

Sy-FAR: Symmetry-based Fair Adversarial Robustness

Arxiv

0+阅读 · 1月19日

CausalSpatial: A Benchmark for Object-Centric Causal Spatial Reasoning

Arxiv

0+阅读 · 1月19日

NeuroShield: A Neuro-Symbolic Framework for Adversarial Robustness

Arxiv

0+阅读 · 1月19日

An analytic theory of convolutional neural network inverse problems solvers

Arxiv

0+阅读 · 1月15日

相关基金

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于免疫机制的无线传感器网络攻击协同检测研究与设计

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率本体的CPS入侵检测方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员