The use of machine learning (ML) has become increasingly prevalent in various domains, highlighting the importance of understanding and ensuring its safety. One pressing concern is the vulnerability of ML applications to model stealing attacks. These attacks involve adversaries attempting to recover a learned model through limited query-response interactions, such as those found in cloud-based services or on-chip artificial intelligence interfaces. While existing literature proposes various attack and defense strategies, these often lack a theoretical foundation and standardized evaluation criteria. In response, this work presents a framework called ``Model Privacy'', providing a foundation for comprehensively analyzing model stealing attacks and defenses. We establish a rigorous formulation for the threat model and objectives, propose methods to quantify the goodness of attack and defense strategies, and analyze the fundamental tradeoffs between utility and privacy in ML models. Our developed theory offers valuable insights into enhancing the security of ML models, especially highlighting the importance of the attack-specific structure of perturbations for effective defenses. We demonstrate the application of model privacy from the defender's perspective through various learning scenarios. Extensive experiments corroborate the insights and the effectiveness of defense mechanisms developed under the proposed framework.


翻译:机器学习(ML)在各领域的应用日益广泛,凸显了理解并确保其安全性的重要性。其中一项紧迫问题在于ML应用易遭受模型窃取攻击。此类攻击中, adversary试图通过有限的查询-响应交互(例如基于云的服务或片上人工智能接口中的交互)来恢复已学习的模型。尽管现有文献提出了多种攻击与防御策略,但这些策略往往缺乏理论基础和标准化评估准则。为此,本研究提出一个名为"模型隐私"的框架,为全面分析模型窃取攻击与防御提供了基础。我们建立了威胁模型与目标的严格形式化表述,提出了量化攻击与防御策略优劣的方法,并分析了ML模型中效用与隐私之间的基本权衡。所发展的理论为增强ML模型的安全性提供了宝贵见解,尤其凸显了防御中针对攻击特性的扰动结构的重要性。我们通过多种学习场景从防御者视角展示了模型隐私的应用。大量实验验证了所提见解以及该框架下开发防御机制的有效性。

0
下载
关闭预览

相关内容

模型提取攻击与防御的系统综述:最新进展与展望
专知会员服务
22+阅读 · 2025年8月24日
深度学习模型反演攻击与防御:全面综述
专知会员服务
26+阅读 · 2025年2月3日
深度学习模型安全:威胁与防御,176页pdf
专知会员服务
28+阅读 · 2024年12月13日
专知会员服务
48+阅读 · 2021年5月17日
人工智能模型数据泄露的攻击与防御研究综述
专知会员服务
77+阅读 · 2021年3月31日
专知会员服务
96+阅读 · 2021年1月17日
专知会员服务
67+阅读 · 2021年1月10日
专知会员服务
40+阅读 · 2020年12月20日
机器学习模型安全与隐私研究综述
专知会员服务
115+阅读 · 2020年11月12日
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
2+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
4+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
3+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
模型提取攻击与防御的系统综述:最新进展与展望
专知会员服务
22+阅读 · 2025年8月24日
深度学习模型反演攻击与防御:全面综述
专知会员服务
26+阅读 · 2025年2月3日
深度学习模型安全:威胁与防御,176页pdf
专知会员服务
28+阅读 · 2024年12月13日
专知会员服务
48+阅读 · 2021年5月17日
人工智能模型数据泄露的攻击与防御研究综述
专知会员服务
77+阅读 · 2021年3月31日
专知会员服务
96+阅读 · 2021年1月17日
专知会员服务
67+阅读 · 2021年1月10日
专知会员服务
40+阅读 · 2020年12月20日
机器学习模型安全与隐私研究综述
专知会员服务
115+阅读 · 2020年11月12日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员