WISE: Web Information Satire and Fakeness Evaluation - 专知论文

会员服务 ·

0

准确率 · 模型评估 · AUC · WISE · ROC ·

WISE: Web Information Satire and Fakeness Evaluation

翻译：WISE：网络信息讽刺性与虚假性评估框架

Gaurab Chhetri,Subasish Das,Tausif Islam Chowdhury

from arxiv, This is the author's preprint. Accepted to WEB&GRAPH 2026 (co-located with WSDM 2026), Boise, Idaho, USA, Feb 26, 2026. Final version will appear in WSDM 2026 Companion Proceedings. Conf: https://wsdm-conference.org/2026/ Workshop: https://aiimlab.org/events/WSDM_2026_WEB_and_GRAPH_2026_Workshop_on_Web_and_Graphs_Responsible_Intelligence_and_Social_Media.html

Distinguishing fake or untrue news from satire or humor poses a unique challenge due to their overlapping linguistic features and divergent intent. This study develops WISE (Web Information Satire and Fakeness Evaluation) framework which benchmarks eight lightweight transformer models alongside two baseline models on a balanced dataset of 20,000 samples from Fakeddit, annotated as either fake news or satire. Using stratified 5-fold cross-validation, we evaluate models across comprehensive metrics including accuracy, precision, recall, F1-score, ROC-AUC, PR-AUC, MCC, Brier score, and Expected Calibration Error. Our evaluation reveals that MiniLM, a lightweight model, achieves the highest accuracy (87.58%) among all models, while RoBERTa-base achieves the highest ROC-AUC (95.42%) and strong accuracy (87.36%). DistilBERT offers an excellent efficiency-accuracy trade-off with 86.28\% accuracy and 93.90\% ROC-AUC. Statistical tests confirm significant performance differences between models, with paired t-tests and McNemar tests providing rigorous comparisons. Our findings highlight that lightweight models can match or exceed baseline performance, offering actionable insights for deploying misinformation detection systems in real-world, resource-constrained settings.

翻译：区分虚假或不实新闻与讽刺或幽默内容因其重叠的语言特征和相异的意图而构成独特挑战。本研究开发了WISE（网络信息讽刺性与虚假性评估）框架，在来自Fakeddit的20,000个标注为虚假新闻或讽刺内容的平衡数据集上，对八种轻量级Transformer模型及两种基线模型进行基准测试。通过分层五折交叉验证，我们使用包括准确率、精确率、召回率、F1分数、ROC-AUC、PR-AUC、MCC、Brier分数和期望校准误差在内的综合指标评估模型性能。评估结果表明，轻量级模型MiniLM在所有模型中取得最高准确率（87.58%），而RoBERTa-base获得最高ROC-AUC（95.42%）并保持较强准确率（87.36%）。DistilBERT在效率与准确率间展现出优异平衡，达到86.28%准确率与93.90% ROC-AUC。统计检验通过配对t检验和McNemar检验证实模型间存在显著性能差异。我们的研究结果强调，轻量级模型能够匹配甚至超越基线性能，为在现实世界资源受限环境中部署虚假信息检测系统提供了可行见解。

0

相关内容

准确率

虚假信息检测综述

虚假信息检测综述

专知会员服务

8+阅读 · 2025年7月9日

大模型时代怎么做假新闻检测？康奈尔大学等最新《适应大规模语言模型时代的假新闻检测》详细阐述大模型下假新闻检测方式

大模型时代怎么做假新闻检测？康奈尔大学等最新《适应大规模语言模型时代的假新闻检测》详细阐述大模型下假新闻检测方式

专知会员服务

46+阅读 · 2023年11月19日

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

专知会员服务

56+阅读 · 2023年10月16日

《作为颠覆性创新的误导信息》2023最新88页论文

《作为颠覆性创新的误导信息》2023最新88页论文

专知会员服务

53+阅读 · 2023年8月30日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

社交网络中的虚假信息:定义、检测及控制

专知会员服务

28+阅读 · 2021年8月15日

网络信息生态系统中的虚假信息：检测、缓解与挑战

专知会员服务

27+阅读 · 2021年8月7日

虚假评论识别研究综述

专知会员服务

52+阅读 · 2021年1月19日

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

专知会员服务

20+阅读 · 2020年11月7日

【KDD2019|讲座推荐】虚假新闻研究：理论、发现策略与开放性问题：Fake News Research: Theories, Detection Strategies, and Open Problems

【KDD2019|讲座推荐】虚假新闻研究：理论、发现策略与开放性问题：Fake News Research: Theories, Detection Strategies, and Open Problems

专知会员服务

43+阅读 · 2019年12月6日

清华刘知远 | 流言能止于智者吗？网络虚假信息的特征与检测

清华刘知远 | 流言能止于智者吗？网络虚假信息的特征与检测

AI科技评论

17+阅读 · 2019年12月5日

智源-计算所虚假新闻检测大赛 | 探秘假新闻中的视觉信息

智源-计算所虚假新闻检测大赛 | 探秘假新闻中的视觉信息

PaperWeekly

18+阅读 · 2019年9月24日

《打击假新闻: 识别和缓解技术调查》(附加42页PDF下载)

《打击假新闻: 识别和缓解技术调查》(附加42页PDF下载)

专知

16+阅读 · 2019年4月19日

热点！虚假新闻检测综述

热点！虚假新闻检测综述

专知

111+阅读 · 2019年2月26日

一文看懂虚假新闻检测（附数据集 & 论文推荐）

一文看懂虚假新闻检测（附数据集 & 论文推荐）

PaperWeekly

36+阅读 · 2019年2月19日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

专知

20+阅读 · 2018年6月29日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

Kaggle 恶意评论(toxic comment classification)分类 top 1 %方案

Kaggle 恶意评论(toxic comment classification)分类 top 1 %方案

AI研习社

11+阅读 · 2018年4月1日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于核与核度理论的在线社交网络拓扑结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

移动社会网络中情境感知的多维个性化信任评价研究

国家自然科学基金

2+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于智能信息处理的Web服务可信性预测与评估技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

负面在线评论和商家反馈对消费者个体态度和群体观点演化的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

URMF: Uncertainty-aware Robust Multimodal Fusion for Multimodal Sarcasm Detection

Arxiv

0+阅读 · 5月3日

CoNewsReader: Supporting Comprehensive Understanding and Raising Critical Thoughts on Social Media News Through Comments

Arxiv

0+阅读 · 4月30日

Many Ways to Be Fake: Benchmarking Fake News Detection Under Strategy-Driven AI Generation

Arxiv

0+阅读 · 4月10日

TRACE: Transparent Web Reliability Assessment with Contextual Explanations

Arxiv

0+阅读 · 4月2日

An Experimental Comparison of the Most Popular Approaches to Fake News Detection

Arxiv

0+阅读 · 3月26日

CritiSense: Critical Digital Literacy and Resilience Against Misinformation

Arxiv

0+阅读 · 3月17日

PhishDebate: An LLM-Based Multi-Agent Framework for Phishing Website Detection

Arxiv

0+阅读 · 3月9日

SemFuzz: A Semantics-Aware Fuzzing Framework for Network Protocol Implementations

Arxiv

0+阅读 · 3月6日

MViR: Multi-View Visual-Semantic Representation for Fake News Detection

Arxiv

0+阅读 · 2月26日

ViLBias: Detecting and Reasoning about Bias in Multimodal Content

Arxiv

0+阅读 · 2月22日

VIP会员

文章信息

相关主题

最新内容

CVPR 2026教程｜扩散模型原理：连续、离散与实时生成

CVPR 2026教程｜扩散模型原理：连续、离散与实时生成

专知会员服务

1+阅读 · 今天13:30

重磅综述｜大模型智能体环境工程：建模、合成、评估与协同演化

重磅综述｜大模型智能体环境工程：建模、合成、评估与协同演化

专知会员服务

1+阅读 · 今天13:28

面向特种部队的、以操作员为中心的人工智能决策支持系统框架

面向特种部队的、以操作员为中心的人工智能决策支持系统框架

专知会员服务

5+阅读 · 今天7:54

《多域战场上反制小型无人机系统》150页

《多域战场上反制小型无人机系统》150页

专知会员服务

14+阅读 · 今天7:47

《基于成果军事教育框架下的军官联合职业军事教育认证程序》2026最新170页

《基于成果军事教育框架下的军官联合职业军事教育认证程序》2026最新170页

专知会员服务

5+阅读 · 今天7:43

战场人工智能：增强陆地作战能力的发现与要求

战场人工智能：增强陆地作战能力的发现与要求

专知会员服务

3+阅读 · 今天7:37

人工智能赋能指挥所：以人工智能为中心的指挥控制的核心要素

人工智能赋能指挥所：以人工智能为中心的指挥控制的核心要素

专知会员服务

7+阅读 · 今天7:33

以人工智能为中心的指挥控制

以人工智能为中心的指挥控制

专知会员服务

3+阅读 · 今天7:14

《通过适应复杂环境与特殊作战行动动态来变革情报周期》

《通过适应复杂环境与特殊作战行动动态来变革情报周期》

专知会员服务

4+阅读 · 今天4:15

俄乌冲突背景下军事特种公路运输日益增长的重要性

俄乌冲突背景下军事特种公路运输日益增长的重要性

专知会员服务

4+阅读 · 今天3:44

速度优先于谨慎：NSPM-11意味着什么（将人工智能融入美国国防和情报行动最全面的声明）

速度优先于谨慎：NSPM-11意味着什么（将人工智能融入美国国防和情报行动最全面的声明）

专知会员服务

9+阅读 · 6月10日

《基于深度强化学习的反无人机技术研究》178页

《基于深度强化学习的反无人机技术研究》178页

专知会员服务

13+阅读 · 6月10日

技术突破与战略优势竞争：美军人工智能技术运用阶段分析

技术突破与战略优势竞争：美军人工智能技术运用阶段分析

专知会员服务

8+阅读 · 6月10日

“史诗怒火”行动与“AI中心战”模式的浮现

“史诗怒火”行动与“AI中心战”模式的浮现

专知会员服务

14+阅读 · 6月10日

【CVPR2026教程】扩散模型的解析理解

【CVPR2026教程】扩散模型的解析理解

专知会员服务

6+阅读 · 6月10日

相关VIP内容

虚假信息检测综述

虚假信息检测综述

专知会员服务

8+阅读 · 2025年7月9日

大模型时代怎么做假新闻检测？康奈尔大学等最新《适应大规模语言模型时代的假新闻检测》详细阐述大模型下假新闻检测方式

大模型时代怎么做假新闻检测？康奈尔大学等最新《适应大规模语言模型时代的假新闻检测》详细阐述大模型下假新闻检测方式

专知会员服务

46+阅读 · 2023年11月19日

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

专知会员服务

56+阅读 · 2023年10月16日

《作为颠覆性创新的误导信息》2023最新88页论文

《作为颠覆性创新的误导信息》2023最新88页论文

专知会员服务

53+阅读 · 2023年8月30日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

社交网络中的虚假信息:定义、检测及控制

专知会员服务

28+阅读 · 2021年8月15日

网络信息生态系统中的虚假信息：检测、缓解与挑战

专知会员服务

27+阅读 · 2021年8月7日

虚假评论识别研究综述

专知会员服务

52+阅读 · 2021年1月19日

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

专知会员服务

20+阅读 · 2020年11月7日

【KDD2019|讲座推荐】虚假新闻研究：理论、发现策略与开放性问题：Fake News Research: Theories, Detection Strategies, and Open Problems

【KDD2019|讲座推荐】虚假新闻研究：理论、发现策略与开放性问题：Fake News Research: Theories, Detection Strategies, and Open Problems

专知会员服务

43+阅读 · 2019年12月6日

热门VIP内容

开通专知VIP会员享更多权益服务

重磅综述｜大模型智能体环境工程：建模、合成、评估与协同演化

《多域战场上反制小型无人机系统》150页

CVPR 2026教程｜扩散模型原理：连续、离散与实时生成

面向特种部队的、以操作员为中心的人工智能决策支持系统框架

相关资讯

清华刘知远 | 流言能止于智者吗？网络虚假信息的特征与检测

清华刘知远 | 流言能止于智者吗？网络虚假信息的特征与检测

AI科技评论

17+阅读 · 2019年12月5日

智源-计算所虚假新闻检测大赛 | 探秘假新闻中的视觉信息

智源-计算所虚假新闻检测大赛 | 探秘假新闻中的视觉信息

PaperWeekly

18+阅读 · 2019年9月24日

《打击假新闻: 识别和缓解技术调查》(附加42页PDF下载)

《打击假新闻: 识别和缓解技术调查》(附加42页PDF下载)

专知

16+阅读 · 2019年4月19日

热点！虚假新闻检测综述

热点！虚假新闻检测综述

专知

111+阅读 · 2019年2月26日

一文看懂虚假新闻检测（附数据集 & 论文推荐）

一文看懂虚假新闻检测（附数据集 & 论文推荐）

PaperWeekly

36+阅读 · 2019年2月19日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

专知

20+阅读 · 2018年6月29日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

Kaggle 恶意评论(toxic comment classification)分类 top 1 %方案

Kaggle 恶意评论(toxic comment classification)分类 top 1 %方案

AI研习社

11+阅读 · 2018年4月1日

相关论文

URMF: Uncertainty-aware Robust Multimodal Fusion for Multimodal Sarcasm Detection

Arxiv

0+阅读 · 5月3日

CoNewsReader: Supporting Comprehensive Understanding and Raising Critical Thoughts on Social Media News Through Comments

Arxiv

0+阅读 · 4月30日

Many Ways to Be Fake: Benchmarking Fake News Detection Under Strategy-Driven AI Generation

Arxiv

0+阅读 · 4月10日

TRACE: Transparent Web Reliability Assessment with Contextual Explanations

Arxiv

0+阅读 · 4月2日

An Experimental Comparison of the Most Popular Approaches to Fake News Detection

Arxiv

0+阅读 · 3月26日

CritiSense: Critical Digital Literacy and Resilience Against Misinformation

Arxiv

0+阅读 · 3月17日

PhishDebate: An LLM-Based Multi-Agent Framework for Phishing Website Detection

Arxiv

0+阅读 · 3月9日

SemFuzz: A Semantics-Aware Fuzzing Framework for Network Protocol Implementations

Arxiv

0+阅读 · 3月6日

MViR: Multi-View Visual-Semantic Representation for Fake News Detection

Arxiv

0+阅读 · 2月26日

ViLBias: Detecting and Reasoning about Bias in Multimodal Content

Arxiv

0+阅读 · 2月22日

相关基金

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于核与核度理论的在线社交网络拓扑结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

移动社会网络中情境感知的多维个性化信任评价研究

国家自然科学基金

2+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于智能信息处理的Web服务可信性预测与评估技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

负面在线评论和商家反馈对消费者个体态度和群体观点演化的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员