WeDefense：一款用于防御伪造音频的工具包 (WeDefense: A Toolkit to Defend Against Fake Audio) - 专知论文

会员服务 ·

0

工具 · 代码 · 合成 · 数据库 · 基准 ·

WeDefense: A Toolkit to Defend Against Fake Audio

翻译：WeDefense：一款用于防御伪造音频的工具包

Lin Zhang,Johan Rohdin,Xin Wang,Junyi Peng,Tianchi Liu,You Zhang,Hieu-Thi Luong,Shuai Wang,Chengdong Liang,Anna Silnova,Nicholas Evans

from arxiv, This is an ongoing work. v1 corresponds to the version completed by June 4, 2025 and previously submitted to ASRU 2025

The advances in generative AI have enabled the creation of synthetic audio which is perceptually indistinguishable from real, genuine audio. Although this stellar progress enables many positive applications, it also raises risks of misuse, such as for impersonation, disinformation and fraud. Despite a growing number of open-source fake audio detection codes released through numerous challenges and initiatives, most are tailored to specific competitions, datasets or models. A standardized and unified toolkit that supports the fair benchmarking and comparison of competing solutions with not just common databases, protocols, metrics, but also a shared codebase, is missing. To address this, we propose WeDefense, the first open-source toolkit to support both fake audio detection and localization. Beyond model training, WeDefense emphasizes critical yet often overlooked components: flexible input and augmentation, calibration, score fusion, standardized evaluation metrics, and analysis tools for deeper understanding and interpretation. The toolkit is publicly available at https://github.com/zlin0/wedefense with interactive demos for fake audio detection and localization.

翻译：生成式人工智能的进展使得合成音频在感知上已与真实音频难以区分。尽管这一卓越进展催生了众多积极应用，但也带来了滥用风险，例如身份冒充、虚假信息传播和欺诈行为。尽管通过各类挑战和倡议已发布越来越多的开源伪造音频检测代码，但大多数代码仅针对特定竞赛、数据集或模型定制。目前尚缺乏一个标准化、统一的工具包，该工具包不仅应支持使用通用数据库、协议和指标对竞争性解决方案进行公平基准测试与比较，还应提供共享的代码库。为此，我们提出了WeDefense——首个同时支持伪造音频检测与定位的开源工具包。除模型训练外，WeDefense强调关键但常被忽视的组件：灵活的输入与数据增强、校准、分数融合、标准化评估指标，以及用于深入理解和结果分析的工具。该工具包已在https://github.com/zlin0/wedefense公开提供，并包含伪造音频检测与定位的交互式演示。

0

相关内容

【ICCV2025】AIGI-Holmes：面向可解释性与可泛化性的AI生成图像检测方法 —— 基于多模态大语言模型的研究

【ICCV2025】AIGI-Holmes：面向可解释性与可泛化性的AI生成图像检测方法 —— 基于多模态大语言模型的研究

专知会员服务

10+阅读 · 2025年7月4日

《内容凭证：加强生成式人工智能时代的多媒体完整性》最新25页报告

《内容凭证：加强生成式人工智能时代的多媒体完整性》最新25页报告

专知会员服务

19+阅读 · 2025年3月4日

《综述：生成式人工智能对虚假新闻的影响》

《综述：生成式人工智能对虚假新闻的影响》

专知会员服务

34+阅读 · 2024年4月13日

《网络战中的深度伪造：威胁、检测、技术和对策》

《网络战中的深度伪造：威胁、检测、技术和对策》

专知会员服务

49+阅读 · 2023年11月22日

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

专知会员服务

41+阅读 · 2023年10月29日

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

专知会员服务

49+阅读 · 2023年6月6日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

专知会员服务

45+阅读 · 2022年3月1日

最新《Deepfakes：创造与检测》2020综述论文，36页pdf

最新《Deepfakes：创造与检测》2020综述论文，36页pdf

专知会员服务

65+阅读 · 2020年5月15日

【中科院信工所】视听觉深度伪造检测技术研究综述

【中科院信工所】视听觉深度伪造检测技术研究综述

专知会员服务

43+阅读 · 2020年4月15日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

深度伪造与检测技术综述(中文版)，25页pdf

深度伪造与检测技术综述(中文版)，25页pdf

专知

13+阅读 · 2020年12月12日

Kaldi拜拜！PyTorch语音工具包SpeechBrain要来了，支持多种语音任务，实现最强水准

Kaldi拜拜！PyTorch语音工具包SpeechBrain要来了，支持多种语音任务，实现最强水准

量子位

10+阅读 · 2019年9月12日

Deformable Kernels，用于图像/视频去噪，即将开源

Deformable Kernels，用于图像/视频去噪，即将开源

极市平台

13+阅读 · 2019年8月29日

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

AI100

29+阅读 · 2019年6月28日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

Spooftooph - 用于欺骗或克隆蓝牙设备的自动工具

Spooftooph - 用于欺骗或克隆蓝牙设备的自动工具

黑白之道

17+阅读 · 2019年2月27日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于声光光谱成像的反激光窃听告警系统关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

视频防抖关键性技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

数字音频被动取证关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于发音特征的汉语语音识别分层解码方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

How to Label Resynthesized Audio: The Dual Role of Neural Audio Codecs in Audio Deepfake Detection

Arxiv

0+阅读 · 2月18日

AuTAgent: A Reinforcement Learning Framework for Tool-Augmented Audio Reasoning

Arxiv

0+阅读 · 2月14日

AUDETER: A Large-scale Dataset for Deepfake Audio Detection in Open Worlds

Arxiv

0+阅读 · 2月11日

AI-Generated Music Detection in Broadcast Monitoring

Arxiv

0+阅读 · 2月6日

HyperPotter: Spell the Charm of High-Order Interactions in Audio Deepfake Detection

Arxiv

0+阅读 · 2月5日

HoliAntiSpoof: Audio LLM for Holistic Speech Anti-Spoofing

Arxiv

0+阅读 · 2月4日

HierCon: Hierarchical Contrastive Attention for Audio Deepfake Detection

Arxiv

0+阅读 · 2月1日

TalkingHeadBench: A Multi-Modal Benchmark & Analysis of Talking-Head DeepFake Detection

Arxiv

0+阅读 · 1月20日

Context and Transcripts Improve Detection of Deepfake Audios of Public Figures

Arxiv

0+阅读 · 1月19日

XMAD-Bench: Cross-Domain Multilingual Audio Deepfake Benchmark

Arxiv

0+阅读 · 1月18日

VIP会员

文章信息

相关主题

最新内容

延伸海上作战中心的触角：如何保持舰队从陆地到海洋的连通

延伸海上作战中心的触角：如何保持舰队从陆地到海洋的连通

专知会员服务

2+阅读 · 今天16:00

美军“数据2030”概念设想：数字化杀伤链统一标准

美军“数据2030”概念设想：数字化杀伤链统一标准

专知会员服务

1+阅读 · 今天15:32

《自主集群系统的战略架构：多域集成、韧性及海上作战框架（2025-2035）》（2026报告）

《自主集群系统的战略架构：多域集成、韧性及海上作战框架（2025-2035）》（2026报告）

专知会员服务

2+阅读 · 今天15:08

前沿军事人工智能系统的理解与控制（报告1.8万字）

前沿军事人工智能系统的理解与控制（报告1.8万字）

专知会员服务

1+阅读 · 今天14:54

《机器学习赋能情报工作：国家安全的机遇与风险》（报告）

《机器学习赋能情报工作：国家安全的机遇与风险》（报告）

专知会员服务

2+阅读 · 今天14:51

《人工智能赋能电磁战》（报告）

《人工智能赋能电磁战》（报告）

专知会员服务

1+阅读 · 今天14:47

《海基核巡航导弹（SLCM-N）部署后的威慑动态与操作要求》（报告）

《海基核巡航导弹（SLCM-N）部署后的威慑动态与操作要求》（报告）

专知会员服务

1+阅读 · 今天14:34

超越卫星通信：战术无线电与网络防御如何锻造联盟韧性（美军报告）

超越卫星通信：战术无线电与网络防御如何锻造联盟韧性（美军报告）

专知会员服务

1+阅读 · 今天14:22

【CMU博士论文】迈向可扩展的开放世界三维感知

【CMU博士论文】迈向可扩展的开放世界三维感知

专知会员服务

1+阅读 · 今天14:06

前馈式三维场景建模

前馈式三维场景建模

专知会员服务

1+阅读 · 今天14:03

《反小型无人机系统的雷达高度估计相干干扰研究》60页

《反小型无人机系统的雷达高度估计相干干扰研究》60页

专知会员服务

4+阅读 · 今天9:52

人工智能战争迷雾：洞悉乌克兰、加沙和伊朗三战区

人工智能战争迷雾：洞悉乌克兰、加沙和伊朗三战区

专知会员服务

6+阅读 · 今天9:28

（中文）以机器速度作战：来自Maven特遣队主任的见解

（中文）以机器速度作战：来自Maven特遣队主任的见解

专知会员服务

9+阅读 · 今天3:42

（中文）AUKUS第二支柱中的人工智能与自主性方案

（中文）AUKUS第二支柱中的人工智能与自主性方案

专知会员服务

4+阅读 · 今天3:24

（译文）认知战：以士兵为目标，塑造战略

（译文）认知战：以士兵为目标，塑造战略

专知会员服务

3+阅读 · 今天3:12

相关VIP内容

【ICCV2025】AIGI-Holmes：面向可解释性与可泛化性的AI生成图像检测方法 —— 基于多模态大语言模型的研究

【ICCV2025】AIGI-Holmes：面向可解释性与可泛化性的AI生成图像检测方法 —— 基于多模态大语言模型的研究

专知会员服务

10+阅读 · 2025年7月4日

《内容凭证：加强生成式人工智能时代的多媒体完整性》最新25页报告

《内容凭证：加强生成式人工智能时代的多媒体完整性》最新25页报告

专知会员服务

19+阅读 · 2025年3月4日

《综述：生成式人工智能对虚假新闻的影响》

《综述：生成式人工智能对虚假新闻的影响》

专知会员服务

34+阅读 · 2024年4月13日

《网络战中的深度伪造：威胁、检测、技术和对策》

《网络战中的深度伪造：威胁、检测、技术和对策》

专知会员服务

49+阅读 · 2023年11月22日

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

专知会员服务

41+阅读 · 2023年10月29日

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

专知会员服务

49+阅读 · 2023年6月6日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

专知会员服务

45+阅读 · 2022年3月1日

最新《Deepfakes：创造与检测》2020综述论文，36页pdf

最新《Deepfakes：创造与检测》2020综述论文，36页pdf

专知会员服务

65+阅读 · 2020年5月15日

【中科院信工所】视听觉深度伪造检测技术研究综述

【中科院信工所】视听觉深度伪造检测技术研究综述

专知会员服务

43+阅读 · 2020年4月15日

热门VIP内容

开通专知VIP会员享更多权益服务

美军“数据2030”概念设想：数字化杀伤链统一标准

前沿军事人工智能系统的理解与控制（报告1.8万字）

延伸海上作战中心的触角：如何保持舰队从陆地到海洋的连通

《自主集群系统的战略架构：多域集成、韧性及海上作战框架（2025-2035）》（2026报告）

相关资讯

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

深度伪造与检测技术综述(中文版)，25页pdf

深度伪造与检测技术综述(中文版)，25页pdf

专知

13+阅读 · 2020年12月12日

Kaldi拜拜！PyTorch语音工具包SpeechBrain要来了，支持多种语音任务，实现最强水准

Kaldi拜拜！PyTorch语音工具包SpeechBrain要来了，支持多种语音任务，实现最强水准

量子位

10+阅读 · 2019年9月12日

Deformable Kernels，用于图像/视频去噪，即将开源

Deformable Kernels，用于图像/视频去噪，即将开源

极市平台

13+阅读 · 2019年8月29日

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

AI100

29+阅读 · 2019年6月28日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

Spooftooph - 用于欺骗或克隆蓝牙设备的自动工具

Spooftooph - 用于欺骗或克隆蓝牙设备的自动工具

黑白之道

17+阅读 · 2019年2月27日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

相关论文

How to Label Resynthesized Audio: The Dual Role of Neural Audio Codecs in Audio Deepfake Detection

Arxiv

0+阅读 · 2月18日

AuTAgent: A Reinforcement Learning Framework for Tool-Augmented Audio Reasoning

Arxiv

0+阅读 · 2月14日

AUDETER: A Large-scale Dataset for Deepfake Audio Detection in Open Worlds

Arxiv

0+阅读 · 2月11日

AI-Generated Music Detection in Broadcast Monitoring

Arxiv

0+阅读 · 2月6日

HyperPotter: Spell the Charm of High-Order Interactions in Audio Deepfake Detection

Arxiv

0+阅读 · 2月5日

HoliAntiSpoof: Audio LLM for Holistic Speech Anti-Spoofing

Arxiv

0+阅读 · 2月4日

HierCon: Hierarchical Contrastive Attention for Audio Deepfake Detection

Arxiv

0+阅读 · 2月1日

TalkingHeadBench: A Multi-Modal Benchmark & Analysis of Talking-Head DeepFake Detection

Arxiv

0+阅读 · 1月20日

Context and Transcripts Improve Detection of Deepfake Audios of Public Figures

Arxiv

0+阅读 · 1月19日

XMAD-Bench: Cross-Domain Multilingual Audio Deepfake Benchmark

Arxiv

0+阅读 · 1月18日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于声光光谱成像的反激光窃听告警系统关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

视频防抖关键性技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

数字音频被动取证关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于发音特征的汉语语音识别分层解码方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员