Diffusion Reconstruction towards Generalizable Audio Deepfake Detection - 专知论文

会员服务 ·

0

泛化 · 伪造检测 · 重建 · 样本 · 深度伪造检测 ·

Diffusion Reconstruction towards Generalizable Audio Deepfake Detection

翻译：面向可泛化音频深度伪造检测的扩散重建方法

Bo Cheng,Songjun Cao,Xiaoming Zhang,Jie Chen,Long Ma,Fei Chen

from arxiv, 5 pages, this paper was submitted to Interspeech2026 for review

Achieving robust generalization against unseen attacks remains a challenge in Audio Deepfake Detection (ADD), driven by the rapid evolution of generative models. To address this, we propose a framework centered on hard sample classification. The core idea is that a model capable of distinguishing challenging hard samples is inherently equipped to handle simpler cases effectively. We investigate multiple reconstruction paradigms, identifying the diffusion-based method as optimal for generating hard samples. Furthermore, we leverage multi-layer feature aggregation and introduce a Regularization-Assisted Contrastive Learning (RACL) objective to enhance generalizability. Experiments demonstrate the superior generalization of our approach, with our best model achieving a significant reduction in the average Equal Error Rate (EER) compared to the baseline.

翻译：音频深度伪造检测（Audio Deepfake Detection, ADD）中，生成模型的快速演进使得面对未知攻击时实现稳健泛化仍是一大挑战。为此，我们提出以难样本分类为核心的框架，其核心理念在于：能够区分高难度样本的模型自然具备处理简单案例的能力。我们研究了多种重建范式，发现基于扩散的样本生成方法最优。进一步地，我们利用多层特征聚合，并引入正则化辅助对比学习（Regularization-Assisted Contrastive Learning, RACL）目标以增强泛化能力。实验表明，本方法具有优越的泛化性能，相较于基准方法，最优模型在平均等错误率（Equal Error Rate, EER）上取得了显著降低。

0

相关内容

《深度伪造防御系统评估的系统性方法》

《深度伪造防御系统评估的系统性方法》

专知会员服务

15+阅读 · 3月16日

基于深度学习的伪装目标检测研究进展

基于深度学习的伪装目标检测研究进展

专知会员服务

31+阅读 · 2025年4月12日

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述，覆盖主流基准库、模型

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述，覆盖主流基准库、模型

专知会员服务

17+阅读 · 2025年1月12日

深度伪造生成与检测：基准测试和综述

深度伪造生成与检测：基准测试和综述

专知会员服务

52+阅读 · 2024年3月27日

《网络战中的深度伪造：威胁、检测、技术和对策》

《网络战中的深度伪造：威胁、检测、技术和对策》

专知会员服务

50+阅读 · 2023年11月22日

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

专知会员服务

42+阅读 · 2023年10月29日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

视觉深度伪造检测技术综述

视觉深度伪造检测技术综述

专知会员服务

37+阅读 · 2022年1月28日

深度伪造与检测技术综述

专知会员服务

76+阅读 · 2020年12月12日

【深度伪造综述论文】The Creation and Detection of Deepfakes: A Survey

【深度伪造综述论文】The Creation and Detection of Deepfakes: A Survey

专知会员服务

55+阅读 · 2020年4月26日

深度伪造与检测技术综述(中文版)，25页pdf

深度伪造与检测技术综述(中文版)，25页pdf

专知

13+阅读 · 2020年12月12日

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

专知

16+阅读 · 2019年5月29日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

AI前线

10+阅读 · 2018年11月2日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

一文概览基于深度学习的超分辨率重建架构

一文概览基于深度学习的超分辨率重建架构

论智

23+阅读 · 2018年3月24日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

综述：深度学习时代的目标检测算法

综述：深度学习时代的目标检测算法

极市平台

27+阅读 · 2018年3月17日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

陷波频率精确可调的FIR稀疏多频陷波器设计算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于密集快速特征提取的可视媒体篡改检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习和马尔科夫逻辑网络的特殊视频识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

数字音频被动取证关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Audio Deepfake Detection with Half-Truth Localisation Using Cross-Attentive Feature Fusion

Arxiv

0+阅读 · 5月28日

DeePen: Penetration Testing for Audio Deepfake Detection

Arxiv

0+阅读 · 5月13日

Robust Deepfake Detection: Mitigating Spatial Attention Drift via Calibrated Complementary Ensembles

Arxiv

0+阅读 · 4月28日

AIFIND: Artifact-Aware Interpreting Fine-Grained Alignment for Incremental Face Forgery Detection

Arxiv

0+阅读 · 4月17日

AudioMoG: Guiding Audio Generation with Mixture-of-Guidance

Arxiv

0+阅读 · 4月9日

Diffusion-Guided Adversarial Perturbation Injection for Generalizable Defense Against Facial Manipulations

Arxiv

0+阅读 · 4月2日

Evolutionary Multi-Objective Fusion of Deepfake Speech Detectors

Arxiv

0+阅读 · 4月1日

Enhancing Efficiency and Performance in Deepfake Audio Detection through Neuron-level Dropin & Neuroplasticity Mechanisms

Arxiv

0+阅读 · 3月26日

SAVe: Self-Supervised Audio-visual Deepfake Detection Exploiting Visual Artifacts and Audio-visual Misalignment

Arxiv

0+阅读 · 3月26日

Collaborative Evaluation of Deepfake Text with Deliberation-Enhancing Dialogue Systems

Arxiv

0+阅读 · 3月24日

VIP会员

文章信息

相关主题

深度伪造检测

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

2+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

《深度伪造防御系统评估的系统性方法》

《深度伪造防御系统评估的系统性方法》

专知会员服务

15+阅读 · 3月16日

基于深度学习的伪装目标检测研究进展

基于深度学习的伪装目标检测研究进展

专知会员服务

31+阅读 · 2025年4月12日

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述，覆盖主流基准库、模型

ACM Computing Surveys | 港大等基于可靠性视角的深度伪造检测综述，覆盖主流基准库、模型

专知会员服务

17+阅读 · 2025年1月12日

深度伪造生成与检测：基准测试和综述

深度伪造生成与检测：基准测试和综述

专知会员服务

52+阅读 · 2024年3月27日

《网络战中的深度伪造：威胁、检测、技术和对策》

《网络战中的深度伪造：威胁、检测、技术和对策》

专知会员服务

50+阅读 · 2023年11月22日

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

《深度伪造检测模型的准确性和鲁棒性》2023最新论文

专知会员服务

42+阅读 · 2023年10月29日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

视觉深度伪造检测技术综述

视觉深度伪造检测技术综述

专知会员服务

37+阅读 · 2022年1月28日

深度伪造与检测技术综述

专知会员服务

76+阅读 · 2020年12月12日

【深度伪造综述论文】The Creation and Detection of Deepfakes: A Survey

【深度伪造综述论文】The Creation and Detection of Deepfakes: A Survey

专知会员服务

55+阅读 · 2020年4月26日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

深度伪造与检测技术综述(中文版)，25页pdf

深度伪造与检测技术综述(中文版)，25页pdf

专知

13+阅读 · 2020年12月12日

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

专知

16+阅读 · 2019年5月29日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

AI前线

10+阅读 · 2018年11月2日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

一文概览基于深度学习的超分辨率重建架构

一文概览基于深度学习的超分辨率重建架构

论智

23+阅读 · 2018年3月24日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

综述：深度学习时代的目标检测算法

综述：深度学习时代的目标检测算法

极市平台

27+阅读 · 2018年3月17日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

相关论文

Audio Deepfake Detection with Half-Truth Localisation Using Cross-Attentive Feature Fusion

Arxiv

0+阅读 · 5月28日

DeePen: Penetration Testing for Audio Deepfake Detection

Arxiv

0+阅读 · 5月13日

Robust Deepfake Detection: Mitigating Spatial Attention Drift via Calibrated Complementary Ensembles

Arxiv

0+阅读 · 4月28日

AIFIND: Artifact-Aware Interpreting Fine-Grained Alignment for Incremental Face Forgery Detection

Arxiv

0+阅读 · 4月17日

AudioMoG: Guiding Audio Generation with Mixture-of-Guidance

Arxiv

0+阅读 · 4月9日

Diffusion-Guided Adversarial Perturbation Injection for Generalizable Defense Against Facial Manipulations

Arxiv

0+阅读 · 4月2日

Evolutionary Multi-Objective Fusion of Deepfake Speech Detectors

Arxiv

0+阅读 · 4月1日

Enhancing Efficiency and Performance in Deepfake Audio Detection through Neuron-level Dropin & Neuroplasticity Mechanisms

Arxiv

0+阅读 · 3月26日

SAVe: Self-Supervised Audio-visual Deepfake Detection Exploiting Visual Artifacts and Audio-visual Misalignment

Arxiv

0+阅读 · 3月26日

Collaborative Evaluation of Deepfake Text with Deliberation-Enhancing Dialogue Systems

Arxiv

0+阅读 · 3月24日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

陷波频率精确可调的FIR稀疏多频陷波器设计算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于密集快速特征提取的可视媒体篡改检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习和马尔科夫逻辑网络的特殊视频识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

数字音频被动取证关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员