SEW: Strengthening Robustness of Black-box DNN Watermarking via Specificity Enhancement - 专知论文

会员服务 ·

0

特异 · DNN · 黑盒 · 攻击 · 鲁棒 ·

SEW: Strengthening Robustness of Black-box DNN Watermarking via Specificity Enhancement

翻译：SEW：通过特异性增强强化黑盒DNN水印的鲁棒性

Huming Qiu,Mi Zhang,Junjie Sun,Peiyi Chen,Xiaohan Zhang,Min Yang

from arxiv, Accepted by KDD 2026

To ensure the responsible distribution and use of open-source deep neural networks (DNNs), DNN watermarking has become a crucial technique to trace and verify unauthorized model replication or misuse. In practice, black-box watermarks manifest as specific predictive behaviors for specially crafted samples. However, due to the generalization nature of DNNs, the keys to extracting the watermark message are not unique, which would provide attackers with more opportunities. Advanced attack techniques can reverse-engineer approximate replacements for the original watermark keys, enabling subsequent watermark removal. In this paper, we explore black-box DNN watermarking specificity, which refers to the accuracy of a watermark's response to a key. Using this concept, we introduce Specificity-Enhanced Watermarking (SEW), a new method that improves specificity by reducing the association between the watermark and approximate keys. Through extensive evaluation using three popular watermarking benchmarks, we validate that enhancing specificity significantly contributes to strengthening robustness against removal attacks. SEW effectively defends against six state-of-the-art removal attacks, while maintaining model usability and watermark verification performance.

翻译：为确保开源深度神经网络（DNN）的负责任分发与使用，DNN水印技术已成为追踪和验证未经授权的模型复制或滥用的关键技术。在实际应用中，黑盒水印表现为针对特殊构造样本的特定预测行为。然而，由于DNN固有的泛化特性，提取水印信息的关键并非唯一，这为攻击者提供了更多可乘之机。先进的攻击技术能够逆向工程出原始水印密钥的近似替代品，从而实现后续的水印移除。本文深入探讨了黑盒DNN水印的特异性，即水印对密钥响应的精确程度。基于这一概念，我们提出了特异性增强水印（SEW）这一新方法，该方法通过削弱水印与近似密钥之间的关联来提升特异性。通过使用三种主流的水印基准进行广泛评估，我们验证了增强特异性对于提升抗移除攻击鲁棒性的显著贡献。SEW能有效防御六种最先进的移除攻击，同时保持模型可用性与水印验证性能。

0

相关内容

面向 AI 生成图像的安全与鲁棒水印：全面综述

面向 AI 生成图像的安全与鲁棒水印：全面综述

专知会员服务

14+阅读 · 2025年10月6日

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

专知会员服务

76+阅读 · 2023年5月11日

DNN如何对抗物理攻击？北航最新《物理世界中的视觉对抗攻击与防御》综述，详述物理对抗攻击防御体系

DNN如何对抗物理攻击？北航最新《物理世界中的视觉对抗攻击与防御》综述，详述物理对抗攻击防御体系

专知会员服务

50+阅读 · 2023年4月23日

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

专知会员服务

32+阅读 · 2022年11月7日

图神经网络黑盒攻击近期进展

图神经网络黑盒攻击近期进展

专知会员服务

19+阅读 · 2022年10月14日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

人工智能模型水印研究综述

专知会员服务

28+阅读 · 2021年7月16日

【CVPR2021】兼容黑盒白盒、抵御水印攻击，全新框架高效保护GAN知识产权

专知会员服务

12+阅读 · 2021年5月9日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

Graph Neural Network（GNN）最全资源整理分享

Graph Neural Network（GNN）最全资源整理分享

深度学习与NLP

339+阅读 · 2019年7月9日

基于GAN的图像水印去除器，效果堪比PS高手

基于GAN的图像水印去除器，效果堪比PS高手

AI100

12+阅读 · 2019年6月25日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

31页PPT概述：图神经网络表达能力有多强？

31页PPT概述：图神经网络表达能力有多强？

AI100

29+阅读 · 2019年2月18日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于程序多模态的动态软件水印方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于非对称扩展的可逆水印研究

国家自然科学基金

0+阅读 · 2015年12月31日

通信信号中的隐蔽信息传输机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

基于光谱的喷墨打印设备全墨色特性化高效建模方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

矢量地图数据的非对称数字水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

ShapeMark: Robust and Diversity-Preserving Watermarking for Diffusion Models

Arxiv

0+阅读 · 3月10日

Lite-BD: A Lightweight Black-box Backdoor Defense via Reviving Multi-Stage Image Transformations

Arxiv

0+阅读 · 2月17日

MarkSweep: A No-box Removal Attack on AI-Generated Image Watermarking via Noise Intensification and Frequency-aware Denoising

Arxiv

0+阅读 · 2月17日

TriniMark: A Robust Generative Speech Watermarking Method for Trinity-Level Traceability

Arxiv

0+阅读 · 2月15日

DWBench: Holistic Evaluation of Watermark for Dataset Copyright Auditing

Arxiv

0+阅读 · 2月14日

OSI: One-step Inversion Excels in Extracting Diffusion Watermarks

Arxiv

0+阅读 · 2月10日

Traceable Black-box Watermarks for Federated Learning

Arxiv

0+阅读 · 2月8日

Shallow Diffuse: Robust and Invisible Watermarking through Low-Dimensional Subspaces in Diffusion Models

Arxiv

0+阅读 · 2月6日

ALIEN: Analytic Latent Watermarking for Controllable Generation

Arxiv

0+阅读 · 2月5日

Improving Detection of Watermarked Language Models

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

3+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

5+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

3+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

2+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

10+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

7+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

5+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

3+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

6+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

3+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

3+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

7+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

6+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

10+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

5+阅读 · 4月20日

相关VIP内容

面向 AI 生成图像的安全与鲁棒水印：全面综述

面向 AI 生成图像的安全与鲁棒水印：全面综述

专知会员服务

14+阅读 · 2025年10月6日

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

专知会员服务

76+阅读 · 2023年5月11日

DNN如何对抗物理攻击？北航最新《物理世界中的视觉对抗攻击与防御》综述，详述物理对抗攻击防御体系

DNN如何对抗物理攻击？北航最新《物理世界中的视觉对抗攻击与防御》综述，详述物理对抗攻击防御体系

专知会员服务

50+阅读 · 2023年4月23日

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

专知会员服务

32+阅读 · 2022年11月7日

图神经网络黑盒攻击近期进展

图神经网络黑盒攻击近期进展

专知会员服务

19+阅读 · 2022年10月14日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

人工智能模型水印研究综述

专知会员服务

28+阅读 · 2021年7月16日

【CVPR2021】兼容黑盒白盒、抵御水印攻击，全新框架高效保护GAN知识产权

专知会员服务

12+阅读 · 2021年5月9日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

Graph Neural Network（GNN）最全资源整理分享

Graph Neural Network（GNN）最全资源整理分享

深度学习与NLP

339+阅读 · 2019年7月9日

基于GAN的图像水印去除器，效果堪比PS高手

基于GAN的图像水印去除器，效果堪比PS高手

AI100

12+阅读 · 2019年6月25日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

31页PPT概述：图神经网络表达能力有多强？

31页PPT概述：图神经网络表达能力有多强？

AI100

29+阅读 · 2019年2月18日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

相关论文

ShapeMark: Robust and Diversity-Preserving Watermarking for Diffusion Models

Arxiv

0+阅读 · 3月10日

Lite-BD: A Lightweight Black-box Backdoor Defense via Reviving Multi-Stage Image Transformations

Arxiv

0+阅读 · 2月17日

MarkSweep: A No-box Removal Attack on AI-Generated Image Watermarking via Noise Intensification and Frequency-aware Denoising

Arxiv

0+阅读 · 2月17日

TriniMark: A Robust Generative Speech Watermarking Method for Trinity-Level Traceability

Arxiv

0+阅读 · 2月15日

DWBench: Holistic Evaluation of Watermark for Dataset Copyright Auditing

Arxiv

0+阅读 · 2月14日

OSI: One-step Inversion Excels in Extracting Diffusion Watermarks

Arxiv

0+阅读 · 2月10日

Traceable Black-box Watermarks for Federated Learning

Arxiv

0+阅读 · 2月8日

Shallow Diffuse: Robust and Invisible Watermarking through Low-Dimensional Subspaces in Diffusion Models

Arxiv

0+阅读 · 2月6日

ALIEN: Analytic Latent Watermarking for Controllable Generation

Arxiv

0+阅读 · 2月5日

Improving Detection of Watermarked Language Models

Arxiv

0+阅读 · 2月3日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于程序多模态的动态软件水印方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于非对称扩展的可逆水印研究

国家自然科学基金

0+阅读 · 2015年12月31日

通信信号中的隐蔽信息传输机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

基于光谱的喷墨打印设备全墨色特性化高效建模方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

矢量地图数据的非对称数字水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员