Among Us: Language of Conspiracy Theorists on Mainstream Reddit - 专知论文

会员服务 ·

0

Among Us: Language of Conspiracy Theorists on Mainstream Reddit

翻译：《Among Us：主流Reddit上阴谋理论家的语言特征》

Francesco Corso,Giuseppe Russo,Francesco Pierri,Gianmarco De Francisci Morales

from arxiv, Accepted for publication at ACL 2026

The interaction between fringe subcultures and mainstream online communities poses significant challenges for understanding discourse on social media. In this work, we investigate whether users active in conspiracy-focused communities exhibit detectable linguistic signatures when participating in general-interest spaces, such as news, humor, or hobbyist forums. We analyze a large-scale longitudinal dataset of over 500 million comments spanning 10 years of Reddit activity, examining the communication patterns of these users across diverse social contexts independent of the topics they discuss. We show that these users exhibit distinctive linguistic patterns that enable machine learning models to reliably distinguish them from the general population within individual communities (averaging 87\% accuracy across more than 20 binary classification tasks). Crucially, no single aggregate model captures these patterns across communities, as community-specific models outperform global classifiers by up to 17 percentage points. This result suggests that while these users are distinct, their linguistic expression is dynamic and highly responsive to the social norms of the environment they inhabit. Our findings suggest the need for tailored interventions in online spaces, as linguistic signals associated with conspiracy and fringe subcultures vary across communities and cannot be effectively addressed by uniform detection or moderation strategies.

翻译：边缘亚文化与主流在线社区之间的互动对理解社交媒体话语构成了重大挑战。本研究探讨了活跃于阴谋论社区的用戶在参与一般兴趣空间（如新闻、幽默或爱好论坛）时，是否表现出可检测的语言特征。我们分析了一个跨越10年Reddit活动、包含超过5亿条评论的大规模纵向数据集，考察这些用户在不同社会语境中独立于其讨论主题的沟通模式。研究表明，这些用户展现出独特的语言模式，使得机器学习模型能够在个体社区内可靠地将他们与普通用户区分开来（在超过20个二分类任务中平均准确率达87%）。关键在于，没有一个单一的聚合模型能够跨社区捕捉这些模式——社区特定模型的表现比全局分类器高出多达17个百分点。这一结果表明，尽管这些用户具有独特性，但其语言表达具有动态性，且高度适应所处环境的社会规范。我们的发现提示在线空间需要采取针对性干预措施，因为与阴谋论及边缘亚文化相关的语言信号在不同社区间存在差异，无法通过统一的检测或审核策略有效应对。

0

相关内容

《俄乌战争中的宣传说服技巧分析》120页

《俄乌战争中的宣传说服技巧分析》120页

专知会员服务

6+阅读 · 5月8日

《DIVERSE：基于视频评论立场分析解读互联网对美国军事的看法——立场分类的新基准数据集》最新论文

《DIVERSE：基于视频评论立场分析解读互联网对美国军事的看法——立场分类的新基准数据集》最新论文

专知会员服务

20+阅读 · 2024年3月18日

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

专知会员服务

46+阅读 · 2023年8月27日

《从社交媒体上协调的敌对信息活动中预测集体暴力》2022.12最新103页论文

《从社交媒体上协调的敌对信息活动中预测集体暴力》2022.12最新103页论文

专知会员服务

30+阅读 · 2023年2月17日

【AI+军事】附论文+PPT《通过社会网络中的行为进行人格分析：在军事背景下的应用》

【AI+军事】附论文+PPT《通过社会网络中的行为进行人格分析：在军事背景下的应用》

专知会员服务

24+阅读 · 2022年4月13日

【ICWSM2021】仇恨言论：检测与管制等，142页ppt

专知会员服务

21+阅读 · 2021年6月27日

神经网络与形式语言综述，12页pdf，A Survey of Neural Networks and Formal Languages

神经网络与形式语言综述，12页pdf，A Survey of Neural Networks and Formal Languages

专知会员服务

21+阅读 · 2020年6月4日

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

专知会员服务

79+阅读 · 2020年2月12日

【ACL 2019 Tutorials】话语分析及其应用（Discourse Analysis and Its Applications），Shafiq Joty，Giuseppe Carenini，Raymond Ng，Gabriel Murray

【ACL 2019 Tutorials】话语分析及其应用（Discourse Analysis and Its Applications），Shafiq Joty，Giuseppe Carenini，Raymond Ng，Gabriel Murray

专知会员服务

11+阅读 · 2019年11月16日

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

专知会员服务

16+阅读 · 2019年10月25日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

50+阅读 · 2022年11月16日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

专知

12+阅读 · 2020年5月14日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

专知

15+阅读 · 2019年9月22日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

一份超全的NLP语料资源集合及其构建现状

一份超全的NLP语料资源集合及其构建现状

七月在线实验室

33+阅读 · 2019年1月16日

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

专知

35+阅读 · 2018年10月7日

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

专知

52+阅读 · 2018年6月28日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于主动异构监督的重叠社区发现及其模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

读者视角的跨领域隐式情感分析理论及关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

大数据环境下多媒体网络舆情信息的语义识别与危机响应研究

国家自然科学基金

4+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

mdok-style at SemEval-2026 Task 10: Finetuning LLMs for Conspiracy Detection

Arxiv

0+阅读 · 5月4日

Confident, Calibrated, or Complicit: Safety Alignment and Ideological Bias in LLM Hate Speech Detection

Arxiv

0+阅读 · 5月4日

Measuring the Semantic Structure and Evolution of Conspiracy Theories

Arxiv

0+阅读 · 4月17日

The Enforcement and Feasibility of Hate Speech Moderation on Twitter

Arxiv

0+阅读 · 4月14日

Characterizing Scam-Driven Human Trafficking Across Chinese Borders and Online Community Responses on RedNote

Arxiv

0+阅读 · 3月27日

I Want to Believe (but the Vocabulary Changed): Measuring the Semantic Structure and Evolution of Conspiracy Theories

Arxiv

0+阅读 · 3月27日

Network Analysis of the Egyptian Reddit Community

Arxiv

0+阅读 · 3月24日

Grievance Politics vs. Policy Debates: A Cross-Platform Analysis of Conservative Discourse on Truth Social and Reddit

Arxiv

0+阅读 · 3月18日

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

Arxiv

0+阅读 · 3月8日

Tower of Babel in Cross-Cultural Communication: A Case Study of #Give Me a Chinese Name# Dialogues During the "TikTok Refugees'' Event

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

专知会员服务

0+阅读 · 今天15:03

智能体技能综合综述：分类、技术与应用

智能体技能综合综述：分类、技术与应用

专知会员服务

0+阅读 · 今天15:00

整合兵棋推演与模拟以增强军事后勤（中英文版PDF下载）

整合兵棋推演与模拟以增强军事后勤（中英文版PDF下载）

专知会员服务

14+阅读 · 今天4:03

多智能体指挥与控制（C2）场景：面向雷达任务的可扩展多智能体协同算法研究 300页

多智能体指挥与控制（C2）场景：面向雷达任务的可扩展多智能体协同算法研究 300页

专知会员服务

15+阅读 · 今天3:38

《美战争部人工智能计划》27页slides

《美战争部人工智能计划》27页slides

专知会员服务

14+阅读 · 今天3:33

《俄乌战争背景下关于俄罗斯的战略信息、情报与展望》书籍400页

《俄乌战争背景下关于俄罗斯的战略信息、情报与展望》书籍400页

专知会员服务

7+阅读 · 今天3:15

下一代高超音速能力

下一代高超音速能力

专知会员服务

5+阅读 · 今天3:10

《敌方主动对抗条件下攻击型无人机蜂群打击任务建模》

《敌方主动对抗条件下攻击型无人机蜂群打击任务建模》

专知会员服务

10+阅读 · 今天3:05

10大无人机蜂群如何改变现代空战的规划与作战方式

10大无人机蜂群如何改变现代空战的规划与作战方式

专知会员服务

5+阅读 · 今天2:42

【ICML2026】大型视觉语言模型在注意力中迷失

【ICML2026】大型视觉语言模型在注意力中迷失

专知会员服务

9+阅读 · 5月10日

【博士论文】机器人生成式建模：从元学习到多模态建模

【博士论文】机器人生成式建模：从元学习到多模态建模

专知会员服务

16+阅读 · 5月10日

美海军EA-18G“咆哮者”与电子攻击的崛起

美海军EA-18G“咆哮者”与电子攻击的崛起

专知会员服务

9+阅读 · 5月10日

回归基本：俄罗斯顿巴斯战役（2015）揭示了现代战争的何种特质

回归基本：俄罗斯顿巴斯战役（2015）揭示了现代战争的何种特质

专知会员服务

7+阅读 · 5月10日

《面向传感器任务分配的分布式协同多智能体架构：海军系统应用》230页

《面向传感器任务分配的分布式协同多智能体架构：海军系统应用》230页

专知会员服务

17+阅读 · 5月10日

《多域作战、新兴军事技术与机动战的未来》（0.75万字，中文版、英文版PDF下载）

《多域作战、新兴军事技术与机动战的未来》（0.75万字，中文版、英文版PDF下载）

专知会员服务

18+阅读 · 5月10日

相关VIP内容

《俄乌战争中的宣传说服技巧分析》120页

《俄乌战争中的宣传说服技巧分析》120页

专知会员服务

6+阅读 · 5月8日

《DIVERSE：基于视频评论立场分析解读互联网对美国军事的看法——立场分类的新基准数据集》最新论文

《DIVERSE：基于视频评论立场分析解读互联网对美国军事的看法——立场分类的新基准数据集》最新论文

专知会员服务

20+阅读 · 2024年3月18日

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

专知会员服务

46+阅读 · 2023年8月27日

《从社交媒体上协调的敌对信息活动中预测集体暴力》2022.12最新103页论文

《从社交媒体上协调的敌对信息活动中预测集体暴力》2022.12最新103页论文

专知会员服务

30+阅读 · 2023年2月17日

【AI+军事】附论文+PPT《通过社会网络中的行为进行人格分析：在军事背景下的应用》

【AI+军事】附论文+PPT《通过社会网络中的行为进行人格分析：在军事背景下的应用》

专知会员服务

24+阅读 · 2022年4月13日

【ICWSM2021】仇恨言论：检测与管制等，142页ppt

专知会员服务

21+阅读 · 2021年6月27日

神经网络与形式语言综述，12页pdf，A Survey of Neural Networks and Formal Languages

神经网络与形式语言综述，12页pdf，A Survey of Neural Networks and Formal Languages

专知会员服务

21+阅读 · 2020年6月4日

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

专知会员服务

79+阅读 · 2020年2月12日

【ACL 2019 Tutorials】话语分析及其应用（Discourse Analysis and Its Applications），Shafiq Joty，Giuseppe Carenini，Raymond Ng，Gabriel Murray

【ACL 2019 Tutorials】话语分析及其应用（Discourse Analysis and Its Applications），Shafiq Joty，Giuseppe Carenini，Raymond Ng，Gabriel Murray

专知会员服务

11+阅读 · 2019年11月16日

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

专知会员服务

16+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体技能综合综述：分类、技术与应用

多智能体指挥与控制（C2）场景：面向雷达任务的可扩展多智能体协同算法研究 300页

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

整合兵棋推演与模拟以增强军事后勤（中英文版PDF下载）

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

50+阅读 · 2022年11月16日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

专知

12+阅读 · 2020年5月14日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

基于端到端深度神经网络的说话人与语言识别综述, 163页ppt,[InterSpeech2019]昆山杜克大学李明博士

专知

15+阅读 · 2019年9月22日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

一份超全的NLP语料资源集合及其构建现状

一份超全的NLP语料资源集合及其构建现状

七月在线实验室

33+阅读 · 2019年1月16日

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

专知

35+阅读 · 2018年10月7日

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

专知

52+阅读 · 2018年6月28日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

相关论文

mdok-style at SemEval-2026 Task 10: Finetuning LLMs for Conspiracy Detection

Arxiv

0+阅读 · 5月4日

Confident, Calibrated, or Complicit: Safety Alignment and Ideological Bias in LLM Hate Speech Detection

Arxiv

0+阅读 · 5月4日

Measuring the Semantic Structure and Evolution of Conspiracy Theories

Arxiv

0+阅读 · 4月17日

The Enforcement and Feasibility of Hate Speech Moderation on Twitter

Arxiv

0+阅读 · 4月14日

Characterizing Scam-Driven Human Trafficking Across Chinese Borders and Online Community Responses on RedNote

Arxiv

0+阅读 · 3月27日

I Want to Believe (but the Vocabulary Changed): Measuring the Semantic Structure and Evolution of Conspiracy Theories

Arxiv

0+阅读 · 3月27日

Network Analysis of the Egyptian Reddit Community

Arxiv

0+阅读 · 3月24日

Grievance Politics vs. Policy Debates: A Cross-Platform Analysis of Conservative Discourse on Truth Social and Reddit

Arxiv

0+阅读 · 3月18日

Brexit Means Brexit: Selection Bias, Echo Chambers, and Entrenched Opinion on Reddit

Arxiv

0+阅读 · 3月8日

Tower of Babel in Cross-Cultural Communication: A Case Study of #Give Me a Chinese Name# Dialogues During the "TikTok Refugees'' Event

Arxiv

0+阅读 · 2月20日

相关基金

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于主动异构监督的重叠社区发现及其模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

读者视角的跨领域隐式情感分析理论及关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

大数据环境下多媒体网络舆情信息的语义识别与危机响应研究

国家自然科学基金

4+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员