Online fake news profoundly distorts public judgment and erodes trust in social platforms. While existing detectors achieve competitive performance on benchmark datasets, they remain notably vulnerable to malicious comments designed specifically to induce misclassification. This evolving threat landscape necessitates detection systems that simultaneously prioritize predictive accuracy and structural robustness. However, current detectors often fail to generalize across diverse and novel comment attack patterns. To bridge this gap, we propose AdComment, an adaptive adversarial training framework for robustness enhancement against diverse malicious comments. Based on cognitive psychology, we categorize adversarial comments into Fact Distortion, Logical Confusion, and Emotional Manipulation, and leverage LLMs to synthesize diverse, category-specific perturbations. Central to our framework is an InfoDirichlet Resampling (IDR) mechanism that dynamically adjusts malicious comment proportions during training, thereby steering optimization toward the model's most susceptible regions. Experimental results demonstrate that our approach achieves state-of-the-art performance on three benchmark datasets, improving the F1 scores by 17.9%, 14.5% and 9.0%, respectively.


翻译:在线虚假新闻严重扭曲公众判断并侵蚀对社交平台的信任。尽管现有检测器在基准数据集上取得了有竞争力的性能,但它们对于专门设计用于诱导错误分类的恶意评论仍然表现出显著的脆弱性。这种不断演变的威胁态势要求检测系统必须同时优先考虑预测准确性和结构鲁棒性。然而,当前的检测器往往难以泛化到多样且新颖的评论攻击模式。为弥补这一差距,我们提出了AdComment,一个用于增强针对多样化恶意评论鲁棒性的自适应对抗训练框架。基于认知心理学,我们将对抗性评论分为事实扭曲、逻辑混淆和情感操纵三类,并利用大语言模型合成多样化、类别特定的扰动。我们框架的核心是信息狄利克雷重采样机制,该机制在训练过程中动态调整恶意评论的比例,从而将优化导向模型最脆弱的区域。实验结果表明,我们的方法在三个基准数据集上实现了最先进的性能,分别将F1分数提高了17.9%、14.5%和9.0%。

0
下载
关闭预览

相关内容

《多模态假新闻检测框架》2023最新80页论文
专知会员服务
44+阅读 · 2023年10月30日
基于多模态学习的虚假新闻检测研究
专知会员服务
34+阅读 · 2023年9月8日
ISWC2020最佳论文《可解释假信息检测的链接可信度评价》
【KDD2020】基于纳什强化学习的鲁棒垃圾邮件发送者检测
专知会员服务
17+阅读 · 2020年8月16日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
读者来稿 | 有效遮挡检测的鲁棒人脸识别
计算机视觉战队
19+阅读 · 2019年3月28日
热点! 虚假新闻检测综述
专知
111+阅读 · 2019年2月26日
一文看懂虚假新闻检测(附数据集 & 论文推荐)
PaperWeekly
36+阅读 · 2019年2月19日
揭秘AI识别虚假新闻背后的原理
DeepTech深科技
10+阅读 · 2018年8月5日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员