Attacks on machine learning models have been extensively studied through stateless optimization. In this paper, we demonstrate how a reinforcement learning (RL) agent can learn a new class of attack algorithms that generate adversarial samples. Unlike traditional adversarial machine learning (AML) methods that craft adversarial samples independently, our RL-based approach retains and exploits past attack experience to improve the effectiveness and efficiency of future attacks. We formulate adversarial sample generation as a Markov Decision Process and evaluate RL's ability to (a) learn effective and efficient attack strategies and (b) compete with state-of-the-art AML. On two image classification benchmarks, our agent increases attack success rate by up to 13.2% and decreases the average number of victim model queries per attack by up to 16.9% from the start to the end of training. In a head-to-head comparison with state-of-the-art image attacks, our approach enables an adversary to generate adversarial samples with 17% more success on unseen inputs post-training. From a security perspective, this work demonstrates a powerful new attack vector that uses RL to train agents that attack ML models efficiently and at scale.


翻译:对机器学习模型的攻击已在无状态优化框架下得到广泛研究。本文展示了一个强化学习智能体如何学习生成对抗样本的新型攻击算法。与传统对抗机器学习方法独立生成对抗样本不同,基于强化学习的方法能够保留并利用历史攻击经验来提升后续攻击的有效性和高效性。我们将对抗样本生成过程建模为马尔可夫决策过程,并评估强化学习在以下两方面的能力:(a) 学习有效且高效的攻击策略;(b) 与当前最优对抗机器学习方法竞争。在两个图像分类基准测试中,从训练初期到末期,智能体将攻击成功率提升了最高13.2%,每次攻击所需的受害者模型查询次数平均减少了16.9%。在与当前最优图像攻击方法的直接对比中,本方法使攻击者在训练后针对未见输入生成对抗样本的成功率提高17%。从安全角度来看,本工作揭示了一种全新的攻击向量,即利用强化学习训练能够高效大规模攻击机器学习模型的智能体。

0
下载
关闭预览

相关内容

《针对指挥控制强化学习智能体的对抗攻击》
专知会员服务
32+阅读 · 2月5日
《指挥和控制强化学习智能体的对抗性攻击》
专知会员服务
71+阅读 · 2024年7月6日
《指挥和控制中强化学习智能体的对抗性攻击》
专知会员服务
73+阅读 · 2024年5月11日
【CVPR2023】基于强化学习的黑盒模型反演攻击
专知会员服务
24+阅读 · 2023年4月12日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
35+阅读 · 2022年1月4日
专知会员服务
23+阅读 · 2021年8月22日
专知会员服务
48+阅读 · 2021年5月17日
专知会员服务
96+阅读 · 2021年1月17日
专知会员服务
99+阅读 · 2020年12月8日
【干货】强化学习在生成对抗网络文本生成中扮演的角色(下)
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2013年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
Arxiv
0+阅读 · 6月16日
Arxiv
0+阅读 · 6月8日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 今天14:45
定向能反无人机系统最新发展动态
专知会员服务
5+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 今天13:33
相关VIP内容
《针对指挥控制强化学习智能体的对抗攻击》
专知会员服务
32+阅读 · 2月5日
《指挥和控制强化学习智能体的对抗性攻击》
专知会员服务
71+阅读 · 2024年7月6日
《指挥和控制中强化学习智能体的对抗性攻击》
专知会员服务
73+阅读 · 2024年5月11日
【CVPR2023】基于强化学习的黑盒模型反演攻击
专知会员服务
24+阅读 · 2023年4月12日
对抗机器学习在网络入侵检测领域的应用
专知会员服务
35+阅读 · 2022年1月4日
专知会员服务
23+阅读 · 2021年8月22日
专知会员服务
48+阅读 · 2021年5月17日
专知会员服务
96+阅读 · 2021年1月17日
专知会员服务
99+阅读 · 2020年12月8日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2013年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员