Deep learning has led to tremendous success in computer vision, largely due to Convolutional Neural Networks (CNNs). However, CNNs have been shown to be vulnerable to crafted adversarial perturbations. This vulnerability of adversarial examples has has motivated research into improving model robustness through adversarial detection and defense methods. In this paper, we address the adversarial robustness of CNNs through causal reasoning. We propose CausAdv: a causal framework for detecting adversarial examples based on counterfactual reasoning. CausAdv learns both causal and non-causal features of every input, and quantifies the counterfactual information (CI) of every filter of the last convolutional layer. We then perform a statistical analysis of the filters' CI across clean and adversarial samples, to demonstrate that adversarial examples exhibit different CI distributions compared to clean samples. Our results show that causal reasoning enhances the process of adversarial detection without the need to train a separate detector. Moreover, we illustrate the efficiency of causal explanations as a helpful detection tool by visualizing the extracted causal features.


翻译:深度学习在计算机视觉领域取得了巨大成功,这主要归功于卷积神经网络(CNNs)。然而,研究表明,CNNs容易受到精心设计的对抗性扰动的攻击。对抗样本的这种脆弱性促使了通过对抗检测与防御方法来提升模型鲁棒性的研究。本文通过因果推理来解决CNNs的对抗鲁棒性问题。我们提出了CausAdv:一种基于反事实推理的对抗样本检测因果框架。CausAdv学习每个输入的因果特征与非因果特征,并对最后一个卷积层中每个滤波器的反事实信息(CI)进行量化。随后,我们对干净样本与对抗样本之间滤波器的CI进行统计分析,以证明对抗样本与干净样本相比呈现出不同的CI分布。我们的结果表明,因果推理能够增强对抗检测的过程,而无需训练单独的检测器。此外,我们通过可视化提取的因果特征,阐明了因果解释作为一种有效检测工具的效率。

0
下载
关闭预览

相关内容

【NUS博士论文】深度视觉算法的对抗鲁棒性研究
专知会员服务
34+阅读 · 2022年11月25日
面向图像数据的对抗样本检测与防御技术综述
专知会员服务
48+阅读 · 2022年6月27日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
35+阅读 · 2022年1月4日
对抗样本生成技术综述
专知会员服务
67+阅读 · 2020年7月21日
【综述】基于图的对抗式攻击和防御,附22页论文下载
专知会员服务
69+阅读 · 2020年3月5日
【浙江大学】对抗样本生成技术综述
专知会员服务
92+阅读 · 2020年1月6日
SemanticAdv:基于语义属性的对抗样本生成方法
机器之心
14+阅读 · 2019年7月12日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
16+阅读 · 2018年7月26日
CNN 模型压缩与加速算法综述
机器学习研究会
16+阅读 · 2017年8月25日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
VIP会员
相关VIP内容
【NUS博士论文】深度视觉算法的对抗鲁棒性研究
专知会员服务
34+阅读 · 2022年11月25日
面向图像数据的对抗样本检测与防御技术综述
专知会员服务
48+阅读 · 2022年6月27日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
35+阅读 · 2022年1月4日
对抗样本生成技术综述
专知会员服务
67+阅读 · 2020年7月21日
【综述】基于图的对抗式攻击和防御,附22页论文下载
专知会员服务
69+阅读 · 2020年3月5日
【浙江大学】对抗样本生成技术综述
专知会员服务
92+阅读 · 2020年1月6日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员