The rapid rise of deepfake technology poses a severe threat to social and political stability by enabling hyper-realistic synthetic media capable of manipulating public perception. However, existing detection methods struggle with two core limitations: (1) modality fragmentation, which leads to poor generalization across diverse and adversarial deepfake modalities; and (2) shallow inter-modal reasoning, resulting in limited detection of fine-grained semantic inconsistencies. To address these, we propose ConLLM (Contrastive Learning with Large Language Models), a hybrid framework for robust multimodal deepfake detection. ConLLM employs a two-stage architecture: stage 1 uses Pre-Trained Models (PTMs) to extract modality-specific embeddings; stage 2 aligns these embeddings via contrastive learning to mitigate modality fragmentation, and refines them using LLM-based reasoning to address shallow inter-modal reasoning by capturing semantic inconsistencies. ConLLM demonstrates strong performance across audio, video, and audio-visual modalities. It reduces audio deepfake EER by up to 50%, improves video accuracy by up to 8%, and achieves approximately 9% accuracy gains in audio-visual tasks. Ablation studies confirm that PTM-based embeddings contribute 9%-10% consistent improvements across modalities.


翻译:深度伪造技术的迅速兴起对社会和政治稳定构成了严重威胁,其生成的超逼真合成媒体能够操纵公众认知。然而,现有检测方法面临两个核心局限:(1) 模态碎片化,导致对不同类型及对抗性深度伪造模态的泛化能力较差;(2) 浅层跨模态推理,导致对细粒度语义不一致性的检测能力有限。为解决这些问题,我们提出ConLLM(基于大语言模型的对比学习框架),一种用于鲁棒多模态深度伪造检测的混合框架。ConLLM采用两阶段架构:第一阶段使用预训练模型提取模态特定嵌入;第二阶段通过对比学习对齐这些嵌入以缓解模态碎片化,并利用基于大语言模型的推理进行精炼,通过捕捉语义不一致性来解决浅层跨模态推理问题。ConLLM在音频、视频及音视频模态上均表现出强大性能:将音频深度伪造的等错误率降低最高达50%,视频检测准确率提升最高达8%,在音视频任务中实现约9%的准确率增益。消融实验证实,基于预训练模型的嵌入为各模态带来了9%-10%的稳定性能提升。

0
下载
关闭预览

相关内容

《深度伪造——错误信息、宣传战与信息战》最新报告
专知会员服务
28+阅读 · 2025年7月10日
基于深度学习的伪装目标检测研究进展
专知会员服务
30+阅读 · 2025年4月12日
《网络战中的深度伪造: 威胁、检测、技术和对策》
专知会员服务
47+阅读 · 2023年11月22日
《深度伪造检测模型的准确性和鲁棒性》2023最新论文
专知会员服务
41+阅读 · 2023年10月29日
基于多模态学习的虚假新闻检测研究
专知会员服务
34+阅读 · 2023年9月8日
「多模态深度伪造及检测技术」最新2023研究综述
专知会员服务
41+阅读 · 2023年3月26日
视觉深度伪造检测技术综述
专知会员服务
37+阅读 · 2022年1月28日
专知会员服务
76+阅读 · 2020年12月12日
深度伪造与检测技术综述(中文版),25页pdf
专知
13+阅读 · 2020年12月12日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
一文看懂虚假新闻检测(附数据集 & 论文推荐)
PaperWeekly
36+阅读 · 2019年2月19日
揭秘AI识别虚假新闻背后的原理
DeepTech深科技
10+阅读 · 2018年8月5日
【机器视觉】表面缺陷检测:机器视觉检测技术
产业智能官
25+阅读 · 2018年5月30日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
《深度伪造——错误信息、宣传战与信息战》最新报告
专知会员服务
28+阅读 · 2025年7月10日
基于深度学习的伪装目标检测研究进展
专知会员服务
30+阅读 · 2025年4月12日
《网络战中的深度伪造: 威胁、检测、技术和对策》
专知会员服务
47+阅读 · 2023年11月22日
《深度伪造检测模型的准确性和鲁棒性》2023最新论文
专知会员服务
41+阅读 · 2023年10月29日
基于多模态学习的虚假新闻检测研究
专知会员服务
34+阅读 · 2023年9月8日
「多模态深度伪造及检测技术」最新2023研究综述
专知会员服务
41+阅读 · 2023年3月26日
视觉深度伪造检测技术综述
专知会员服务
37+阅读 · 2022年1月28日
专知会员服务
76+阅读 · 2020年12月12日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员