Machine learning models are critically susceptible to evasion attacks from adversarial examples. Generally, adversarial examples, modified inputs deceptively similar to the original input, are constructed under whitebox settings by adversaries with full access to the model. However, recent attacks have shown a remarkable reduction in query numbers to craft adversarial examples using blackbox attacks. Particularly, alarming is the ability to exploit the classification decision from the access interface of a trained model provided by a growing number of Machine Learning as a Service providers including Google, Microsoft, IBM and used by a plethora of applications incorporating these models. The ability of an adversary to exploit only the predicted label from a model to craft adversarial examples is distinguished as a decision-based attack. In our study, we first deep dive into recent state-of-the-art decision-based attacks in ICLR and SP to highlight the costly nature of discovering low distortion adversarial employing gradient estimation methods. We develop a robust query efficient attack capable of avoiding entrapment in a local minimum and misdirection from noisy gradients seen in gradient estimation methods. The attack method we propose, RamBoAttack, exploits the notion of Randomized Block Coordinate Descent to explore the hidden classifier manifold, targeting perturbations to manipulate only localized input features to address the issues of gradient estimation methods. Importantly, the RamBoAttack is more robust to the different sample inputs available to an adversary and the targeted class. Overall, for a given target class, RamBoAttack is demonstrated to be more robust at achieving a lower distortion within a given query budget. We curate our extensive results using the large-scale high-resolution ImageNet dataset and open-source our attack, test samples and artifacts on GitHub.


翻译:机器学习模型极易受到对抗样本的逃逸攻击。通常,对抗样本是指与原始输入具有欺骗性相似性的修改输入,在白盒设置下由完全访问模型的对手构建。然而,近期攻击表明,使用黑盒攻击构造对抗样本的查询数量显著减少。尤其令人担忧的是,攻击者能够利用越来越多的机器学习即服务提供商(包括谷歌、微软、IBM)提供的训练模型访问接口中的分类决策,而大量使用这些模型的应用程序也面临此风险。对手仅利用模型预测标签来构造对抗样本的能力被称为基于决策的攻击。在本研究中,我们首先深入剖析ICLR和SP中近期最先进的基于决策的攻击,以揭示使用梯度估计方法发现低失真对抗样本的高昂代价。我们开发了一种鲁棒的查询高效攻击,能够避免陷入局部最小值以及梯度估计方法中噪声梯度导致的误导。我们提出的攻击方法RamBoAttack利用随机块坐标下降的概念来探索隐藏分类器流形,通过针对局部输入特征的扰动操作来解决梯度估计方法的问题。重要的是,RamBoAttack对于对手可用的不同样本输入和目标类别更具鲁棒性。总体而言,在给定的查询预算内,对于特定目标类别,RamBoAttack被证明在实现更低失真方面更具鲁棒性。我们使用大规模高分辨率ImageNet数据集整理了广泛的结果,并在GitHub上开源了我们的攻击方法、测试样本及工件。

0
下载
关闭预览

相关内容

【2022新书】高效深度学习,Efficient Deep Learning Book
专知会员服务
128+阅读 · 2022年4月21日
专知会员服务
29+阅读 · 2021年8月2日
专知会员服务
46+阅读 · 2020年10月31日
7 Papers & Radios | IJCAI 2022杰出论文;苹果2D GAN转3D
机器之心
0+阅读 · 2022年7月31日
深度学习模型不确定性方法对比
PaperWeekly
20+阅读 · 2020年2月10日
过参数化、剪枝和网络结构搜索
极市平台
17+阅读 · 2019年11月24日
训练技巧 | 功守道:NLP中的对抗训练 + PyTorch实现
PaperWeekly
12+阅读 · 2019年11月13日
深度卷积神经网络中的降采样
极市平台
12+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月9日
Arxiv
16+阅读 · 2022年11月1日
Arxiv
35+阅读 · 2022年3月14日
Arxiv
35+阅读 · 2021年1月27日
VIP会员
最新内容
消耗优势:美军的“精确规模化”概念
专知会员服务
5+阅读 · 今天10:12
《离线语言支持系统:面向空战战术决策》
专知会员服务
5+阅读 · 今天9:53
俄乌战场地面机器人如何改写战争规则
专知会员服务
9+阅读 · 6月14日
《无人水面艇文献综述与结构设计》135页
专知会员服务
13+阅读 · 6月13日
相关VIP内容
【2022新书】高效深度学习,Efficient Deep Learning Book
专知会员服务
128+阅读 · 2022年4月21日
专知会员服务
29+阅读 · 2021年8月2日
专知会员服务
46+阅读 · 2020年10月31日
相关资讯
7 Papers & Radios | IJCAI 2022杰出论文;苹果2D GAN转3D
机器之心
0+阅读 · 2022年7月31日
深度学习模型不确定性方法对比
PaperWeekly
20+阅读 · 2020年2月10日
过参数化、剪枝和网络结构搜索
极市平台
17+阅读 · 2019年11月24日
训练技巧 | 功守道:NLP中的对抗训练 + PyTorch实现
PaperWeekly
12+阅读 · 2019年11月13日
深度卷积神经网络中的降采样
极市平台
12+阅读 · 2019年5月24日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
相关基金
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员