What Do Deepfake Speech Detectors Actually Hear? - 专知论文

会员服务 ·

0

检测器 · 语音检测 · 深度伪造 · 输出 · 监督 ·

What Do Deepfake Speech Detectors Actually Hear?

翻译：深度伪造语音检测器究竟“听”到了什么？

Vojtěch Staněk,Veronika Jirmusová,Anton Firc,Kamil Malinka,Jakub Reš,Martin Perešíni

from arxiv, Accepted to Interspeech 2026

Deepfake speech detectors often output a single score without explaining why an audio sample is flagged, where in the signal the evidence lies, or what cues drive the decision. We propose an audio-native explainability pipeline using Integrated Gradients on time-aligned self-supervised representations to localize decision evidence over time. We apply the proposed method to three WavLM-based detectors (AASIST, CA-MHFA, SLS) on ASVspoof 5 and manually annotate the highest-attribution regions to provide a semantic meaning of the most important cues. Despite similar performance, the detectors rely on different cues: AASIST emphasizes non-speech/environment cues, CA-MHFA focuses on localized phoneme artifacts, and SLS relies on word boundaries and spectral integrity. We move beyond speculative reasoning and validate our findings by causal masking of the primary detector cues. Observed performance degradation further supports the explained detector semantics.

翻译：深度伪造语音检测器通常只输出一个评分，却未解释为何将某段音频标记为伪造、证据位于信号的何处、或何种线索驱动了决策。为此，我们提出了一种基于音频的可解释性管线，利用时间对齐的自监督表示上的积分梯度方法，在时间维度上定位决策证据。我们将该方法应用于ASVspoof 5上的三个基于WavLM的检测器（AASIST、CA-MHFA、SLS），并人工标注了最高归因区域，以提供最重要线索的语义意义。尽管性能相似，这些检测器依赖不同的线索：AASIST强调非语音/环境线索，CA-MHFA聚焦于局部音素伪影，而SLS则依赖词边界与频谱完整性。我们超越了推测性推理，通过对检测器主要线索进行因果掩码来验证发现，观察到的性能下降进一步支持了所解释的检测器语义。

0

相关内容

检测器

《深度伪造防御系统评估的系统性方法》

《深度伪造防御系统评估的系统性方法》

专知会员服务

15+阅读 · 3月16日

基于深度学习的伪装目标检测研究进展

基于深度学习的伪装目标检测研究进展

专知会员服务

32+阅读 · 2025年4月12日

深度伪造生成与检测：基准测试和综述

深度伪造生成与检测：基准测试和综述

专知会员服务

52+阅读 · 2024年3月27日

《网络战中的深度伪造：威胁、检测、技术和对策》

《网络战中的深度伪造：威胁、检测、技术和对策》

专知会员服务

50+阅读 · 2023年11月22日

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

专知会员服务

42+阅读 · 2023年10月29日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

视觉深度伪造检测技术综述

视觉深度伪造检测技术综述

专知会员服务

37+阅读 · 2022年1月28日

【深度伪造综述论文】The Creation and Detection of Deepfakes: A Survey

【深度伪造综述论文】The Creation and Detection of Deepfakes: A Survey

专知会员服务

55+阅读 · 2020年4月26日

【中科院信工所】视听觉深度伪造检测技术研究综述

【中科院信工所】视听觉深度伪造检测技术研究综述

专知会员服务

43+阅读 · 2020年4月15日

深度伪造与检测技术综述(中文版)，25页pdf

深度伪造与检测技术综述(中文版)，25页pdf

专知

13+阅读 · 2020年12月12日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

专知

14+阅读 · 2018年2月4日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于同步EEG-fMRI多模态神经影像融合的谎言神经机制研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于因子分析的会话语音说话人识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

数字音频被动取证关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于发音特征的汉语语音识别分层解码方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

精神压力下基于物理模型的变异语音生成机理探索及检测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

The Affective Bridge: Preserving Speech Representations while Enhancing Deepfake Detection vian emotional Constraints

Arxiv

0+阅读 · 6月15日

XAI-Grounded Explanation Generation for Speech Deepfake Detection with Training-Free Multimodal Large Language Models

Arxiv

0+阅读 · 6月15日

Phonetically Explainable Speech Deepfake Detection

Arxiv

0+阅读 · 6月13日

HyperPotter: Spell the Charm of High-Order Interactions in Audio Deepfake Detection

Arxiv

0+阅读 · 6月12日

From Talking to Singing: A New Challenge for Audio-Visual Deepfake Detection

Arxiv

0+阅读 · 5月27日

MixFake: Benchmarking and Enhancing Audio Deepfake Detection in Diverse Real-world Mixed Audio

Arxiv

0+阅读 · 5月22日

Profiling the Voice: Speaker-Specific Phoneme Fingerprinting for Speech Deepfake Detection

Arxiv

0+阅读 · 5月18日

DeePen: Penetration Testing for Audio Deepfake Detection

Arxiv

0+阅读 · 5月13日

EchoFake: A Replay-Aware Dataset for Practical Speech Deepfake Detection

Arxiv

0+阅读 · 5月11日

Listening Deepfake Detection: A New Perspective Beyond Speaking-Centric Forgery Analysis

Arxiv

0+阅读 · 4月14日

VIP会员

文章信息

相关主题

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

4+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

5+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

6+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

6+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

4+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

8+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

8+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

8+阅读 · 7月31日

相关VIP内容

《深度伪造防御系统评估的系统性方法》

《深度伪造防御系统评估的系统性方法》

专知会员服务

15+阅读 · 3月16日

基于深度学习的伪装目标检测研究进展

基于深度学习的伪装目标检测研究进展

专知会员服务

32+阅读 · 2025年4月12日

深度伪造生成与检测：基准测试和综述

深度伪造生成与检测：基准测试和综述

专知会员服务

52+阅读 · 2024年3月27日

《网络战中的深度伪造：威胁、检测、技术和对策》

《网络战中的深度伪造：威胁、检测、技术和对策》

专知会员服务

50+阅读 · 2023年11月22日

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

专知会员服务

42+阅读 · 2023年10月29日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

视觉深度伪造检测技术综述

视觉深度伪造检测技术综述

专知会员服务

37+阅读 · 2022年1月28日

【深度伪造综述论文】The Creation and Detection of Deepfakes: A Survey

【深度伪造综述论文】The Creation and Detection of Deepfakes: A Survey

专知会员服务

55+阅读 · 2020年4月26日

【中科院信工所】视听觉深度伪造检测技术研究综述

【中科院信工所】视听觉深度伪造检测技术研究综述

专知会员服务

43+阅读 · 2020年4月15日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

深度伪造与检测技术综述(中文版)，25页pdf

深度伪造与检测技术综述(中文版)，25页pdf

专知

13+阅读 · 2020年12月12日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

专知

14+阅读 · 2018年2月4日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

相关论文

The Affective Bridge: Preserving Speech Representations while Enhancing Deepfake Detection vian emotional Constraints

Arxiv

0+阅读 · 6月15日

XAI-Grounded Explanation Generation for Speech Deepfake Detection with Training-Free Multimodal Large Language Models

Arxiv

0+阅读 · 6月15日

Phonetically Explainable Speech Deepfake Detection

Arxiv

0+阅读 · 6月13日

HyperPotter: Spell the Charm of High-Order Interactions in Audio Deepfake Detection

Arxiv

0+阅读 · 6月12日

From Talking to Singing: A New Challenge for Audio-Visual Deepfake Detection

Arxiv

0+阅读 · 5月27日

MixFake: Benchmarking and Enhancing Audio Deepfake Detection in Diverse Real-world Mixed Audio

Arxiv

0+阅读 · 5月22日

Profiling the Voice: Speaker-Specific Phoneme Fingerprinting for Speech Deepfake Detection

Arxiv

0+阅读 · 5月18日

DeePen: Penetration Testing for Audio Deepfake Detection

Arxiv

0+阅读 · 5月13日

EchoFake: A Replay-Aware Dataset for Practical Speech Deepfake Detection

Arxiv

0+阅读 · 5月11日

Listening Deepfake Detection: A New Perspective Beyond Speaking-Centric Forgery Analysis

Arxiv

0+阅读 · 4月14日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于同步EEG-fMRI多模态神经影像融合的谎言神经机制研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于因子分析的会话语音说话人识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

数字音频被动取证关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于发音特征的汉语语音识别分层解码方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

精神压力下基于物理模型的变异语音生成机理探索及检测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员