The interaction between fringe subcultures and mainstream online communities poses significant challenges for understanding discourse on social media. In this work, we investigate whether users active in conspiracy-focused communities exhibit detectable linguistic signatures when participating in general-interest spaces, such as news, humor, or hobbyist forums. We analyze a large-scale longitudinal dataset of over 500 million comments spanning 10 years of Reddit activity, examining the communication patterns of these users across diverse social contexts independent of the topics they discuss. We show that these users exhibit distinctive linguistic patterns that enable machine learning models to reliably distinguish them from the general population within individual communities (averaging 87\% accuracy across more than 20 binary classification tasks). Crucially, no single aggregate model captures these patterns across communities, as community-specific models outperform global classifiers by up to 17 percentage points. This result suggests that while these users are distinct, their linguistic expression is dynamic and highly responsive to the social norms of the environment they inhabit. Our findings suggest the need for tailored interventions in online spaces, as linguistic signals associated with conspiracy and fringe subcultures vary across communities and cannot be effectively addressed by uniform detection or moderation strategies.


翻译:边缘亚文化与主流在线社区之间的互动对理解社交媒体话语构成了重大挑战。本研究探讨了活跃于阴谋论社区的用戶在参与一般兴趣空间(如新闻、幽默或爱好论坛)时,是否表现出可检测的语言特征。我们分析了一个跨越10年Reddit活动、包含超过5亿条评论的大规模纵向数据集,考察这些用户在不同社会语境中独立于其讨论主题的沟通模式。研究表明,这些用户展现出独特的语言模式,使得机器学习模型能够在个体社区内可靠地将他们与普通用户区分开来(在超过20个二分类任务中平均准确率达87%)。关键在于,没有一个单一的聚合模型能够跨社区捕捉这些模式——社区特定模型的表现比全局分类器高出多达17个百分点。这一结果表明,尽管这些用户具有独特性,但其语言表达具有动态性,且高度适应所处环境的社会规范。我们的发现提示在线空间需要采取针对性干预措施,因为与阴谋论及边缘亚文化相关的语言信号在不同社区间存在差异,无法通过统一的检测或审核策略有效应对。

0
下载
关闭预览

相关内容

《俄乌战争中的宣传说服技巧分析》120页
专知会员服务
6+阅读 · 5月8日
专知会员服务
21+阅读 · 2021年6月27日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
自然语言处理常识推理综述论文,60页pdf
专知
73+阅读 · 2019年4月4日
一份超全的NLP语料资源集合及其构建现状
七月在线实验室
33+阅读 · 2019年1月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关主题
最新内容
智能体技能综合综述:分类、技术与应用
专知会员服务
0+阅读 · 今天15:00
《美战争部人工智能计划》27页slides
专知会员服务
14+阅读 · 今天3:33
下一代高超音速能力
专知会员服务
5+阅读 · 今天3:10
【ICML2026】大型视觉语言模型在注意力中迷失
专知会员服务
9+阅读 · 5月10日
美海军EA-18G“咆哮者”与电子攻击的崛起
专知会员服务
9+阅读 · 5月10日
相关VIP内容
《俄乌战争中的宣传说服技巧分析》120页
专知会员服务
6+阅读 · 5月8日
专知会员服务
21+阅读 · 2021年6月27日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员