OTI: A Model-free and Visually Interpretable Measure of Image Attackability - 专知论文

会员服务 ·

0

攻击 · 度量 · 对抗 · 扰动 · 提取 ·

OTI: A Model-free and Visually Interpretable Measure of Image Attackability

翻译：OTI：一种无模型且视觉可解释的图像可攻击性度量

Jiaming Liang,Haowei Liu,Chi-Man Pun

Despite the tremendous success of neural networks, benign images can be corrupted by adversarial perturbations to deceive these models. Intriguingly, images differ in their attackability. Specifically, given an attack configuration, some images are easily corrupted, whereas others are more resistant. Evaluating image attackability has important applications in active learning, adversarial training, and attack enhancement. This prompts a growing interest in developing attackability measures. However, existing methods are scarce and suffer from two major limitations: (1) They rely on a model proxy to provide prior knowledge (e.g., gradients or minimal perturbation) to extract model-dependent image features. Unfortunately, in practice, many task-specific models are not readily accessible. (2) Extracted features characterizing image attackability lack visual interpretability, obscuring their direct relationship with the images. To address these, we propose a novel Object Texture Intensity (OTI), a model-free and visually interpretable measure of image attackability, which measures image attackability as the texture intensity of the image's semantic object. Theoretically, we describe the principles of OTI from the perspectives of decision boundaries as well as the mid- and high-frequency characteristics of adversarial perturbations. Comprehensive experiments demonstrate that OTI is effective and computationally efficient. In addition, our OTI provides the adversarial machine learning community with a visual understanding of attackability.

翻译：尽管神经网络取得了巨大成功，但良性图像仍可能被对抗性扰动破坏以欺骗这些模型。有趣的是，不同图像的可攻击性存在差异。具体而言，在给定攻击配置下，某些图像容易被破坏，而其他图像则更具抵抗力。评估图像可攻击性在主动学习、对抗训练和攻击增强中具有重要应用价值，这促使人们对开发可攻击性度量的兴趣日益增长。然而，现有方法数量有限且存在两大主要局限：（1）它们依赖模型代理提供先验知识（如梯度或最小扰动）以提取模型相关的图像特征。遗憾的是，在实践中，许多任务特定模型并不易于获取。（2）用于表征图像可攻击性的提取特征缺乏视觉可解释性，使其与图像的直接关系难以理解。为解决这些问题，我们提出了一种新颖的对象纹理强度（OTI）——一种无模型且视觉可解释的图像可攻击性度量，该方法通过图像语义对象的纹理强度来量化图像可攻击性。理论上，我们从决策边界以及对抗性扰动的中高频特性两个角度阐述了OTI的原理。综合实验表明，OTI不仅有效且计算高效。此外，我们的OTI为对抗性机器学习社区提供了对可攻击性的可视化理解。

0

相关内容

深度学习如何可信？港理工等最新《2D和3D深度学习模型对抗性攻击的鲁棒性和安全性》综述，涵盖170篇论文

深度学习如何可信？港理工等最新《2D和3D深度学习模型对抗性攻击的鲁棒性和安全性》综述，涵盖170篇论文

专知会员服务

28+阅读 · 2023年10月3日

【2023新书】网络安全中的对抗性深度学习:攻击分类，防御机制和学习理论

【2023新书】网络安全中的对抗性深度学习:攻击分类，防御机制和学习理论

专知会员服务

52+阅读 · 2023年3月16日

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

专知会员服务

32+阅读 · 2022年11月7日

《定义、测量和分析防御性网络战背景下的可防御性》2022最新106页论文，美国海军研究生院

《定义、测量和分析防御性网络战背景下的可防御性》2022最新106页论文，美国海军研究生院

专知会员服务

34+阅读 · 2022年10月25日

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

专知会员服务

41+阅读 · 2022年10月24日

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

专知会员服务

18+阅读 · 2022年4月26日

【NeurIPS2021】基于贝叶斯优化的图分类对抗攻击

【NeurIPS2021】基于贝叶斯优化的图分类对抗攻击

专知会员服务

18+阅读 · 2021年11月6日

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

专知会员服务

63+阅读 · 2020年4月19日

【综述】基于图的对抗式攻击和防御，附22页论文下载

【综述】基于图的对抗式攻击和防御，附22页论文下载

专知会员服务

69+阅读 · 2020年3月5日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

专知会员服务

49+阅读 · 2019年11月21日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

CVPR 2019 | 无监督领域特定单图像去模糊

CVPR 2019 | 无监督领域特定单图像去模糊

PaperWeekly

14+阅读 · 2019年3月20日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

图像认知中的遮挡影响分析及建模

国家自然科学基金

0+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

面向公共安全的不可控条件下异质人脸图像变换和识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络图像标注中多视图半监督稀疏特征选择算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

VITAL: More Understandable Feature Visualization through Distribution Alignment and Relevant Information Flow

Arxiv

0+阅读 · 2月17日

Hierarchical Refinement of Universal Multimodal Attacks on Vision-Language Models

Arxiv

0+阅读 · 2月17日

GraphFM: A generalist graph transformer that learns transferable representations across diverse domains

Arxiv

0+阅读 · 2月14日

OmniScience: A Large-scale Multi-modal Dataset for Scientific Image Understanding

Arxiv

0+阅读 · 2月14日

ProtoQuant: Quantization of Prototypical Parts For General and Fine-Grained Image Classification

Arxiv

0+阅读 · 2月6日

Sensitivity analysis of image classification models using generalized polynomial chaos

Arxiv

0+阅读 · 2月3日

Q-Hawkeye: Reliable Visual Policy Optimization for Image Quality Assessment

Arxiv

0+阅读 · 1月30日

A new Image Similarity Metric for a Perceptual and Transparent Geometric and Chromatic Assessment

Arxiv

0+阅读 · 1月27日

NIMO: a Nonlinear Interpretable MOdel

Arxiv

0+阅读 · 1月27日

CausAdv: A Causal-based Framework for Detecting Adversarial Examples

Arxiv

0+阅读 · 1月17日

VIP会员

文章信息

相关主题

最新内容

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

2+阅读 · 今天6:14

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

2+阅读 · 今天5:59

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

4+阅读 · 今天5:54

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

3+阅读 · 今天5:51

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

3+阅读 · 今天5:47

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

10+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

11+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

4+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

13+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

6+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

8+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

18+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

5+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

16+阅读 · 4月18日

相关VIP内容

深度学习如何可信？港理工等最新《2D和3D深度学习模型对抗性攻击的鲁棒性和安全性》综述，涵盖170篇论文

深度学习如何可信？港理工等最新《2D和3D深度学习模型对抗性攻击的鲁棒性和安全性》综述，涵盖170篇论文

专知会员服务

28+阅读 · 2023年10月3日

【2023新书】网络安全中的对抗性深度学习:攻击分类，防御机制和学习理论

【2023新书】网络安全中的对抗性深度学习:攻击分类，防御机制和学习理论

专知会员服务

52+阅读 · 2023年3月16日

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

专知会员服务

32+阅读 · 2022年11月7日

《定义、测量和分析防御性网络战背景下的可防御性》2022最新106页论文，美国海军研究生院

《定义、测量和分析防御性网络战背景下的可防御性》2022最新106页论文，美国海军研究生院

专知会员服务

34+阅读 · 2022年10月25日

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

专知会员服务

41+阅读 · 2022年10月24日

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

【AI+军事】附论文《敏感还是不敏感？如何攻击和捍卫文件安全分类模型》

专知会员服务

18+阅读 · 2022年4月26日

【NeurIPS2021】基于贝叶斯优化的图分类对抗攻击

【NeurIPS2021】基于贝叶斯优化的图分类对抗攻击

专知会员服务

18+阅读 · 2021年11月6日

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

专知会员服务

63+阅读 · 2020年4月19日

【综述】基于图的对抗式攻击和防御，附22页论文下载

【综述】基于图的对抗式攻击和防御，附22页论文下载

专知会员服务

69+阅读 · 2020年3月5日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用，附29页PDF

专知会员服务

49+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

军事通信系统与设备的技术演进综述

《北约标准：医疗评估手册》174页

乌克兰前线的五项创新

《北约 AI手册：作战人员的实用考量》（2026最新64页）

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

CVPR 2019 | 无监督领域特定单图像去模糊

CVPR 2019 | 无监督领域特定单图像去模糊

PaperWeekly

14+阅读 · 2019年3月20日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

VITAL: More Understandable Feature Visualization through Distribution Alignment and Relevant Information Flow

Arxiv

0+阅读 · 2月17日

Hierarchical Refinement of Universal Multimodal Attacks on Vision-Language Models

Arxiv

0+阅读 · 2月17日

GraphFM: A generalist graph transformer that learns transferable representations across diverse domains

Arxiv

0+阅读 · 2月14日

OmniScience: A Large-scale Multi-modal Dataset for Scientific Image Understanding

Arxiv

0+阅读 · 2月14日

ProtoQuant: Quantization of Prototypical Parts For General and Fine-Grained Image Classification

Arxiv

0+阅读 · 2月6日

Sensitivity analysis of image classification models using generalized polynomial chaos

Arxiv

0+阅读 · 2月3日

Q-Hawkeye: Reliable Visual Policy Optimization for Image Quality Assessment

Arxiv

0+阅读 · 1月30日

A new Image Similarity Metric for a Perceptual and Transparent Geometric and Chromatic Assessment

Arxiv

0+阅读 · 1月27日

NIMO: a Nonlinear Interpretable MOdel

Arxiv

0+阅读 · 1月27日

CausAdv: A Causal-based Framework for Detecting Adversarial Examples

Arxiv

0+阅读 · 1月17日

相关基金

图像认知中的遮挡影响分析及建模

国家自然科学基金

0+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

面向公共安全的不可控条件下异质人脸图像变换和识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络图像标注中多视图半监督稀疏特征选择算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员