An Experimental Comparison of the Most Popular Approaches to Fake News Detection - 专知论文

会员服务 ·

0

假新闻检测 · 新闻 · 数据集 · 样本 · 检测技术 ·

An Experimental Comparison of the Most Popular Approaches to Fake News Detection

翻译：最流行的假新闻检测方法实验比较

Pietro Dell'Oglio,Alessandro Bondielli,Francesco Marcelloni,Lucia C. Passaro

In recent years, fake news detection has received increasing attention in public debate and scientific research. Despite advances in detection techniques, the production and spread of false information have become more sophisticated, driven by Large Language Models (LLMs) and the amplification power of social media. We present a critical assessment of 12 representative fake news detection approaches, spanning traditional machine learning, deep learning, transformers, and specialized cross-domain architectures. We evaluate these methods on 10 publicly available datasets differing in genre, source, topic, and labeling rationale. We address text-only English fake news detection as a binary classification task by harmonizing labels into "Real" and "Fake" to ensure a consistent evaluation protocol. We acknowledge that label semantics vary across datasets and that harmonization inevitably removes such semantic nuances. Each dataset is treated as a distinct domain. We conduct in-domain, multi-domain and cross-domain experiments to simulate real-world scenarios involving domain shift and out-of-distribution data. Fine-tuned models perform well in-domain but struggle to generalize. Cross-domain architectures can reduce this gap but are data-hungry, while LLMs offer a promising alternative through zero- and few-shot learning. Given inherent dataset confounds and possible pre-training exposure, results should be interpreted as robustness evaluations within this English, text-only protocol.

翻译：近年来，假新闻检测在公共辩论和科学研究中受到越来越多的关注。尽管检测技术不断进步，但大型语言模型（LLMs）和社交媒体的放大效应使得虚假信息的生成与传播变得更加复杂。我们对12种具有代表性的假新闻检测方法进行了批判性评估，涵盖传统机器学习、深度学习、Transformer以及专门的跨领域架构。我们在10个公开数据集上评估了这些方法，这些数据集在体裁、来源、主题和标注逻辑上各不相同。我们将英文纯文本假新闻检测视为二分类任务，通过将标签统一为“真实”和“虚假”来确保一致的评估协议。我们承认不同数据集的标签语义存在差异，且统一化不可避免地会消除这些语义细微差别。每个数据集被视为一个独立领域。我们进行了领域内、多领域和跨领域实验，以模拟涉及领域偏移和分布外数据的真实场景。微调模型在领域内表现良好，但难以泛化。跨领域架构可以缩小这一差距，但数据需求高，而LLMs通过零样本和少样本学习提供了一种有前景的替代方案。考虑到固有的数据集混淆因素和可能的预训练暴露，结果应被视为在此英文纯文本协议下的鲁棒性评估。

0

相关内容

假新闻检测

假新闻检测

《假新闻检测的特征计算流程：基于大语言模型的提取方法》

《假新闻检测的特征计算流程：基于大语言模型的提取方法》

专知会员服务

15+阅读 · 2025年7月3日

大模型时代怎么做假新闻检测？康奈尔大学等最新《适应大规模语言模型时代的假新闻检测》详细阐述大模型下假新闻检测方式

大模型时代怎么做假新闻检测？康奈尔大学等最新《适应大规模语言模型时代的假新闻检测》详细阐述大模型下假新闻检测方式

专知会员服务

46+阅读 · 2023年11月19日

《多模态假新闻检测框架》2023最新80页论文

《多模态假新闻检测框架》2023最新80页论文

专知会员服务

45+阅读 · 2023年10月30日

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

专知会员服务

57+阅读 · 2023年10月16日

基于多模态学习的虚假新闻检测研究

基于多模态学习的虚假新闻检测研究

专知会员服务

34+阅读 · 2023年9月8日

ACL2021 | 知识对比：基于外部知识的图神经虚假新闻检测

专知会员服务

34+阅读 · 2021年9月14日

【KDD2021】基于元神经过程网络的多模态突发性假新闻检测

专知会员服务

34+阅读 · 2021年6月29日

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

专知会员服务

20+阅读 · 2020年11月7日

【论文】持续学习的图神经网络用于检测社交媒体的假新闻，Graph Neural Networks with Continual Learning for Fake News Detection from Social Media

【论文】持续学习的图神经网络用于检测社交媒体的假新闻，Graph Neural Networks with Continual Learning for Fake News Detection from Social Media

专知会员服务

41+阅读 · 2020年7月14日

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

专知会员服务

79+阅读 · 2020年2月12日

深度伪造与检测技术综述(中文版)，25页pdf

深度伪造与检测技术综述(中文版)，25页pdf

专知

13+阅读 · 2020年12月12日

清华刘知远 | 流言能止于智者吗？网络虚假信息的特征与检测

清华刘知远 | 流言能止于智者吗？网络虚假信息的特征与检测

AI科技评论

17+阅读 · 2019年12月5日

智源-计算所虚假新闻检测大赛 | 探秘假新闻中的视觉信息

智源-计算所虚假新闻检测大赛 | 探秘假新闻中的视觉信息

PaperWeekly

18+阅读 · 2019年9月24日

异常检测论文大列表：方法、应用、综述

异常检测论文大列表：方法、应用、综述

专知

126+阅读 · 2019年7月15日

《打击假新闻: 识别和缓解技术调查》(附加42页PDF下载)

《打击假新闻: 识别和缓解技术调查》(附加42页PDF下载)

专知

16+阅读 · 2019年4月19日

热点！虚假新闻检测综述

热点！虚假新闻检测综述

专知

111+阅读 · 2019年2月26日

一文看懂虚假新闻检测（附数据集 & 论文推荐）

一文看懂虚假新闻检测（附数据集 & 论文推荐）

PaperWeekly

36+阅读 · 2019年2月19日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于密集快速特征提取的可视媒体篡改检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

新媒体中考虑群体差异的谣言传播机理及干预策略研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

多重比较中控制FDR的有效检验方法

国家自然科学基金

0+阅读 · 2014年12月31日

Retrieval-Augmented Multimodal Model for Fake News Detection

Arxiv

0+阅读 · 4月29日

Many Ways to Be Fake: Benchmarking Fake News Detection Under Strategy-Driven AI Generation

Arxiv

0+阅读 · 4月10日

CoALFake: Collaborative Active Learning with Human-LLM Co-Annotation for Cross-Domain Fake News Detection

Arxiv

0+阅读 · 4月5日

Is Seeing Believing? Evaluating Human Sensitivity to Synthetic Video

Arxiv

0+阅读 · 3月28日

From Manipulation to Mistrust: Explaining Diverse Micro-Video Misinformation for Robust Debunking in the Wild

Arxiv

0+阅读 · 3月26日

Harmful Visual Content Manipulation Matters in Misinformation Detection Under Multimedia Scenarios

Arxiv

0+阅读 · 3月22日

RADAR: Retrieval-Augmented Detector with Adversarial Refinement for Robust Fake News Detection

Arxiv

0+阅读 · 3月18日

From Veracity to Diffusion: Adressing Operational Challenges in Moving From Fake-News Detection to Information Disorders

Arxiv

0+阅读 · 3月10日

Multi-Sourced, Multi-Agent Evidence Retrieval for Fact-Checking

Arxiv

0+阅读 · 2月27日

MViR: Multi-View Visual-Semantic Representation for Fake News Detection

Arxiv

0+阅读 · 2月26日

VIP会员

文章信息

相关主题

假新闻检测

最新内容

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

2+阅读 · 今天11:43

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

2+阅读 · 今天11:41

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

5+阅读 · 今天6:30

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

5+阅读 · 今天6:18

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

6+阅读 · 今天6:08

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

6+阅读 · 今天5:54

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

7+阅读 · 今天5:22

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

7+阅读 · 今天5:15

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

7+阅读 · 今天3:42

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

5+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

7+阅读 · 6月24日

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

10+阅读 · 6月24日

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

9+阅读 · 6月24日

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

7+阅读 · 6月24日

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

9+阅读 · 6月24日

相关VIP内容

《假新闻检测的特征计算流程：基于大语言模型的提取方法》

《假新闻检测的特征计算流程：基于大语言模型的提取方法》

专知会员服务

15+阅读 · 2025年7月3日

大模型时代怎么做假新闻检测？康奈尔大学等最新《适应大规模语言模型时代的假新闻检测》详细阐述大模型下假新闻检测方式

大模型时代怎么做假新闻检测？康奈尔大学等最新《适应大规模语言模型时代的假新闻检测》详细阐述大模型下假新闻检测方式

专知会员服务

46+阅读 · 2023年11月19日

《多模态假新闻检测框架》2023最新80页论文

《多模态假新闻检测框架》2023最新80页论文

专知会员服务

45+阅读 · 2023年10月30日

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

专知会员服务

57+阅读 · 2023年10月16日

基于多模态学习的虚假新闻检测研究

基于多模态学习的虚假新闻检测研究

专知会员服务

34+阅读 · 2023年9月8日

ACL2021 | 知识对比：基于外部知识的图神经虚假新闻检测

专知会员服务

34+阅读 · 2021年9月14日

【KDD2021】基于元神经过程网络的多模态突发性假新闻检测

专知会员服务

34+阅读 · 2021年6月29日

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

专知会员服务

20+阅读 · 2020年11月7日

【论文】持续学习的图神经网络用于检测社交媒体的假新闻，Graph Neural Networks with Continual Learning for Fake News Detection from Social Media

【论文】持续学习的图神经网络用于检测社交媒体的假新闻，Graph Neural Networks with Continual Learning for Fake News Detection from Social Media

专知会员服务

41+阅读 · 2020年7月14日

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

专知会员服务

79+阅读 · 2020年2月12日

热门VIP内容

开通专知VIP会员享更多权益服务

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

网状网络及其在军事领域的运用

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

相关资讯

深度伪造与检测技术综述(中文版)，25页pdf

深度伪造与检测技术综述(中文版)，25页pdf

专知

13+阅读 · 2020年12月12日

清华刘知远 | 流言能止于智者吗？网络虚假信息的特征与检测

清华刘知远 | 流言能止于智者吗？网络虚假信息的特征与检测

AI科技评论

17+阅读 · 2019年12月5日

智源-计算所虚假新闻检测大赛 | 探秘假新闻中的视觉信息

智源-计算所虚假新闻检测大赛 | 探秘假新闻中的视觉信息

PaperWeekly

18+阅读 · 2019年9月24日

异常检测论文大列表：方法、应用、综述

异常检测论文大列表：方法、应用、综述

专知

126+阅读 · 2019年7月15日

《打击假新闻: 识别和缓解技术调查》(附加42页PDF下载)

《打击假新闻: 识别和缓解技术调查》(附加42页PDF下载)

专知

16+阅读 · 2019年4月19日

热点！虚假新闻检测综述

热点！虚假新闻检测综述

专知

111+阅读 · 2019年2月26日

一文看懂虚假新闻检测（附数据集 & 论文推荐）

一文看懂虚假新闻检测（附数据集 & 论文推荐）

PaperWeekly

36+阅读 · 2019年2月19日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

相关论文

Retrieval-Augmented Multimodal Model for Fake News Detection

Arxiv

0+阅读 · 4月29日

Many Ways to Be Fake: Benchmarking Fake News Detection Under Strategy-Driven AI Generation

Arxiv

0+阅读 · 4月10日

CoALFake: Collaborative Active Learning with Human-LLM Co-Annotation for Cross-Domain Fake News Detection

Arxiv

0+阅读 · 4月5日

Is Seeing Believing? Evaluating Human Sensitivity to Synthetic Video

Arxiv

0+阅读 · 3月28日

From Manipulation to Mistrust: Explaining Diverse Micro-Video Misinformation for Robust Debunking in the Wild

Arxiv

0+阅读 · 3月26日

Harmful Visual Content Manipulation Matters in Misinformation Detection Under Multimedia Scenarios

Arxiv

0+阅读 · 3月22日

RADAR: Retrieval-Augmented Detector with Adversarial Refinement for Robust Fake News Detection

Arxiv

0+阅读 · 3月18日

From Veracity to Diffusion: Adressing Operational Challenges in Moving From Fake-News Detection to Information Disorders

Arxiv

0+阅读 · 3月10日

Multi-Sourced, Multi-Agent Evidence Retrieval for Fact-Checking

Arxiv

0+阅读 · 2月27日

MViR: Multi-View Visual-Semantic Representation for Fake News Detection

Arxiv

0+阅读 · 2月26日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于密集快速特征提取的可视媒体篡改检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

新媒体中考虑群体差异的谣言传播机理及干预策略研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

多重比较中控制FDR的有效检验方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员