While deepfake speech detectors built on large self-supervised learning (SSL) models achieve high accuracy, employing standard ensemble fusion to further enhance robustness often results in oversized systems with diminishing returns. To address this, we propose an evolutionary multi-objective score fusion framework that jointly minimizes detection error and system complexity. We explore two encodings optimized by NSGA-II: binary-coded detector selection for score averaging and a real-valued scheme that optimizes detector weights for a weighted sum. Experiments on the ASVspoof 5 dataset with 36 SSL-based detectors show that the obtained Pareto fronts outperform simple averaging and logistic regression baselines. The real-valued variant achieves 2.37% EER (0.0684 minDCF) and identifies configurations that match state-of-the-art performance while significantly reducing system complexity, requiring only half the parameters. Our method also provides a diverse set of trade-off solutions, enabling deployment choices that balance accuracy and computational cost.


翻译:尽管基于大型自监督学习(SSL)模型的深度伪造语音检测器实现了高精度,但采用标准集成融合来进一步增强鲁棒性通常会导致系统规模过大且收益递减。针对这一问题,我们提出了一种进化式多目标分数融合框架,该框架能同时最小化检测误差和系统复杂度。我们探索了由NSGA-II优化的两种编码方式:用于分数平均的二值编码检测器选择方案,以及优化加权求和检测器权重的实值方案。在包含36个基于SSL的检测器的ASVspoof 5数据集上的实验表明,所获得的Pareto前沿优于简单的平均融合和逻辑回归基线方法。实值变体实现了2.37%的等错误率(EER)(0.0684 minDCF),并识别出与当前最佳性能相匹配、同时显著降低系统复杂度的配置,仅需一半参数。我们的方法还提供了多样化的权衡解决方案,使得能够在准确性和计算成本之间进行部署选择。

0
下载
关闭预览

相关内容

基于深度学习的伪装目标检测研究进展
专知会员服务
31+阅读 · 2025年4月12日
生成式AI时代的深伪媒体生成与检测:综述与展望
专知会员服务
30+阅读 · 2024年12月2日
大型语言模型对齐技术综述:RLHF、RLAIF、PPO、DPO 等
专知会员服务
55+阅读 · 2024年7月24日
大模型如何迭代?北大等《大型语言模型自我进化》综述
《多模态大型语言模型进化》最新综述
专知会员服务
105+阅读 · 2024年2月23日
《深度模型融合》综述
专知会员服务
75+阅读 · 2023年9月28日
《边界监视多传感器融合系统中的目标跟踪》
专知会员服务
54+阅读 · 2023年6月11日
专知会员服务
101+阅读 · 2020年7月20日
专家报告|深度学习+图像多模态融合
中国图象图形学报
12+阅读 · 2019年10月23日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
综述:深度学习时代的目标检测算法
极市平台
27+阅读 · 2018年3月17日
读书报告 | Deep Learning for Extreme Multi-label Text Classification
科技创新与创业
48+阅读 · 2018年1月10日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
14+阅读 · 2023年9月27日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
4+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
4+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
基于深度学习的伪装目标检测研究进展
专知会员服务
31+阅读 · 2025年4月12日
生成式AI时代的深伪媒体生成与检测:综述与展望
专知会员服务
30+阅读 · 2024年12月2日
大型语言模型对齐技术综述:RLHF、RLAIF、PPO、DPO 等
专知会员服务
55+阅读 · 2024年7月24日
大模型如何迭代?北大等《大型语言模型自我进化》综述
《多模态大型语言模型进化》最新综述
专知会员服务
105+阅读 · 2024年2月23日
《深度模型融合》综述
专知会员服务
75+阅读 · 2023年9月28日
《边界监视多传感器融合系统中的目标跟踪》
专知会员服务
54+阅读 · 2023年6月11日
专知会员服务
101+阅读 · 2020年7月20日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员