Audio Pirates: Black-box Audio Watermark Removal via Diffusion Priors - 专知论文

会员服务 ·

0

攻击 · 音频水印 · 黑盒 · 感知质量 · AI ·

Audio Pirates: Black-box Audio Watermark Removal via Diffusion Priors

翻译：Audio Pirates：通过扩散先验的黑盒音频水印移除

Lingfeng Yao,Xincong Zhong,Chenpei Huang,Xuandong Zhao,Hanqing Guo,Aohan Li,Jiang Liu,Tomoaki Ohtsuki,Miao Pan

With the rise of AI-generated audio, watermarking has become widely used for detecting misuse and protecting intellectual property. However, adversaries may try to remove these watermarks, making it critical to evaluate how well watermarking schemes withstand removal attacks. Existing attacks are often impractical: they either noticeably degrade perceptual quality or require access to the watermarking scheme. We propose DiffErase, a black-box watermark removal attack that assumes no knowledge of the target watermarking scheme while maintaining perceptual quality. DiffErase perturbs watermarked audio to an intermediate diffusion noise level and regenerates it using a pretrained denoising model, effectively suppressing watermark signals. Theoretical analysis and extensive experiments demonstrate that inaudible audio watermarks are highly vulnerable: across multiple audio domains, DiffErase consistently removes watermarks while preserving perceptual quality. These findings highlight the need for future audio watermarking designs to consider diffusion-based threats. Code and demos are available at https://differase.github.io/DiffErase/.

翻译：随着AI生成音频的兴起，水印技术已被广泛用于检测滥用和保护知识产权。然而，攻击者可能试图移除这些水印，因此评估水印方案抵御移除攻击的能力至关重要。现有攻击往往不切实际：它们要么显著降低感知质量，要么需要访问水印方案。我们提出DiffErase，一种黑盒水印移除攻击，该攻击无需了解目标水印方案，同时保持感知质量。DiffErase将含水印音频扰动至中间扩散噪声水平，并使用预训练去噪模型重建，从而有效抑制水印信号。理论分析和大量实验表明，不可听音频水印极易受到攻击：在多个音频域中，DiffErase在保持感知质量的同时始终移除水印。这些发现凸显了未来音频水印设计需考虑基于扩散的威胁。代码和演示可在https://differase.github.io/DiffErase/获取。

0

相关内容

综述：AI生成视频检测，从视觉取证走向事实保真验证

综述：AI生成视频检测，从视觉取证走向事实保真验证

专知会员服务

11+阅读 · 7月14日

面向 AI 生成图像的安全与鲁棒水印：全面综述

面向 AI 生成图像的安全与鲁棒水印：全面综述

专知会员服务

14+阅读 · 2025年10月6日

扩散模型时代的可视水印：进展与挑战

扩散模型时代的可视水印：进展与挑战

专知会员服务

7+阅读 · 2025年5月17日

Sora之后，OpenAI Lilian Weng亲自撰文教你从头设计《视频生成扩散模型》

Sora之后，OpenAI Lilian Weng亲自撰文教你从头设计《视频生成扩散模型》

专知会员服务

22+阅读 · 2024年4月22日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

专知会员服务

45+阅读 · 2022年3月1日

人工智能模型水印研究综述

专知会员服务

30+阅读 · 2021年7月16日

【CVPR2021】兼容黑盒白盒、抵御水印攻击，全新框架高效保护GAN知识产权

专知会员服务

12+阅读 · 2021年5月9日

【中科院信工所】视听觉深度伪造检测技术研究综述

【中科院信工所】视听觉深度伪造检测技术研究综述

专知会员服务

43+阅读 · 2020年4月15日

【O'Reilly TensorFlow Conference 2019】恶意软件检测（Generative malware outbreak detection），Sean Park | Trend Micro

【O'Reilly TensorFlow Conference 2019】恶意软件检测（Generative malware outbreak detection），Sean Park | Trend Micro

专知会员服务

15+阅读 · 2019年11月13日

深度伪造与检测技术综述(中文版)，25页pdf

深度伪造与检测技术综述(中文版)，25页pdf

专知

13+阅读 · 2020年12月12日

Deformable Kernels，用于图像/视频去噪，即将开源

Deformable Kernels，用于图像/视频去噪，即将开源

极市平台

13+阅读 · 2019年8月29日

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

AI100

29+阅读 · 2019年6月28日

基于GAN的图像水印去除器，效果堪比PS高手

基于GAN的图像水印去除器，效果堪比PS高手

AI100

12+阅读 · 2019年6月25日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

使用 FastAI 和即时频率变换进行音频分类

使用 FastAI 和即时频率变换进行音频分类

AI研习社

11+阅读 · 2019年5月9日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

基于程序多模态的动态软件水印方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于非对称扩展的可逆水印研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

通信信号中的隐蔽信息传输机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于密集快速特征提取的可视媒体篡改检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

数字音频被动取证关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

矢量地图数据的非对称数字水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Rel-Zero: Harnessing Patch-Pair Invariance for Robust Zero-Watermarking Against AI Editing

Arxiv

0+阅读 · 6月15日

VoxWatermark: A Large-Scale Benchmark for Audio Watermark Detection under Perturbations

Arxiv

0+阅读 · 6月13日

T2S: A Rehearsal-Based Approach for Extraction-Resistant Model Watermarking

Arxiv

0+阅读 · 6月10日

Do Modern Post-Hoc Watermarking Methods Beat Broken-Arrows?

Arxiv

0+阅读 · 5月26日

Hidden in Plain Tokens: Simply Robust, Gradient-Free Watermark for Synthetic Audio

Arxiv

0+阅读 · 5月25日

MixFake: Benchmarking and Enhancing Audio Deepfake Detection in Diverse Real-world Mixed Audio

Arxiv

0+阅读 · 5月22日

XAttnMark: Learning Robust Audio Watermarking with Cross-Attention

Arxiv

0+阅读 · 5月22日

HarmonicAttack: An Adaptive Cross-Domain Audio Watermark Removal

Arxiv

0+阅读 · 5月19日

MusicDET: Zero-Shot AI-Generated Music Detection

Arxiv

0+阅读 · 5月18日

DeePen: Penetration Testing for Audio Deepfake Detection

Arxiv

0+阅读 · 5月13日

VIP会员

文章信息

相关主题

最新内容

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

0+阅读 · 6分钟前

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

11+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

9+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

10+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

5+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

9+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

7+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

7+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

7+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

5+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

9+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

12+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

7+阅读 · 7月31日

相关VIP内容

综述：AI生成视频检测，从视觉取证走向事实保真验证

综述：AI生成视频检测，从视觉取证走向事实保真验证

专知会员服务

11+阅读 · 7月14日

面向 AI 生成图像的安全与鲁棒水印：全面综述

面向 AI 生成图像的安全与鲁棒水印：全面综述

专知会员服务

14+阅读 · 2025年10月6日

扩散模型时代的可视水印：进展与挑战

扩散模型时代的可视水印：进展与挑战

专知会员服务

7+阅读 · 2025年5月17日

Sora之后，OpenAI Lilian Weng亲自撰文教你从头设计《视频生成扩散模型》

Sora之后，OpenAI Lilian Weng亲自撰文教你从头设计《视频生成扩散模型》

专知会员服务

22+阅读 · 2024年4月22日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

专知会员服务

45+阅读 · 2022年3月1日

人工智能模型水印研究综述

专知会员服务

30+阅读 · 2021年7月16日

【CVPR2021】兼容黑盒白盒、抵御水印攻击，全新框架高效保护GAN知识产权

专知会员服务

12+阅读 · 2021年5月9日

【中科院信工所】视听觉深度伪造检测技术研究综述

【中科院信工所】视听觉深度伪造检测技术研究综述

专知会员服务

43+阅读 · 2020年4月15日

【O'Reilly TensorFlow Conference 2019】恶意软件检测（Generative malware outbreak detection），Sean Park | Trend Micro

【O'Reilly TensorFlow Conference 2019】恶意软件检测（Generative malware outbreak detection），Sean Park | Trend Micro

专知会员服务

15+阅读 · 2019年11月13日

热门VIP内容

开通专知VIP会员享更多权益服务

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

相关资讯

深度伪造与检测技术综述(中文版)，25页pdf

深度伪造与检测技术综述(中文版)，25页pdf

专知

13+阅读 · 2020年12月12日

Deformable Kernels，用于图像/视频去噪，即将开源

Deformable Kernels，用于图像/视频去噪，即将开源

极市平台

13+阅读 · 2019年8月29日

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

AI100

29+阅读 · 2019年6月28日

基于GAN的图像水印去除器，效果堪比PS高手

基于GAN的图像水印去除器，效果堪比PS高手

AI100

12+阅读 · 2019年6月25日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

使用 FastAI 和即时频率变换进行音频分类

使用 FastAI 和即时频率变换进行音频分类

AI研习社

11+阅读 · 2019年5月9日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

相关论文

Rel-Zero: Harnessing Patch-Pair Invariance for Robust Zero-Watermarking Against AI Editing

Arxiv

0+阅读 · 6月15日

VoxWatermark: A Large-Scale Benchmark for Audio Watermark Detection under Perturbations

Arxiv

0+阅读 · 6月13日

T2S: A Rehearsal-Based Approach for Extraction-Resistant Model Watermarking

Arxiv

0+阅读 · 6月10日

Do Modern Post-Hoc Watermarking Methods Beat Broken-Arrows?

Arxiv

0+阅读 · 5月26日

Hidden in Plain Tokens: Simply Robust, Gradient-Free Watermark for Synthetic Audio

Arxiv

0+阅读 · 5月25日

MixFake: Benchmarking and Enhancing Audio Deepfake Detection in Diverse Real-world Mixed Audio

Arxiv

0+阅读 · 5月22日

XAttnMark: Learning Robust Audio Watermarking with Cross-Attention

Arxiv

0+阅读 · 5月22日

HarmonicAttack: An Adaptive Cross-Domain Audio Watermark Removal

Arxiv

0+阅读 · 5月19日

MusicDET: Zero-Shot AI-Generated Music Detection

Arxiv

0+阅读 · 5月18日

DeePen: Penetration Testing for Audio Deepfake Detection

Arxiv

0+阅读 · 5月13日

相关基金

基于程序多模态的动态软件水印方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于非对称扩展的可逆水印研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

通信信号中的隐蔽信息传输机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于密集快速特征提取的可视媒体篡改检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

数字音频被动取证关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

矢量地图数据的非对称数字水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员