Context-Aware Detection and Victim-Centered Response Generation for Online Harassment in Private Messaging - 专知论文

会员服务 ·

0

在线 · 数据集 · 讲稿 · INTERACT · 展开 ·

Context-Aware Detection and Victim-Centered Response Generation for Online Harassment in Private Messaging

翻译：面向私人消息中网络霸凌的情境感知检测与以受害者为中心的回复生成

Pinxian Lu,Nimra Ishfaq,Emma Win,Morgan Rose,Sierra R Strickland,Candice L Biernesser,Jamie Zelazny,Munmun De Choudhury

from arxiv, 16 pages, 2 figures

Online harassment is a widespread social and public health concern, yet most computational approaches for detecting and addressing harassment focus on publicly visible social media content rather than private messaging environments. Private conversations present unique challenges because harmful interactions often unfold through context-dependent, multi-turn exchanges, while victims may lack timely support during moments of harassment. In this study, we investigate how large language models (LLMs) can support both the detection of and response to online harassment in private messaging. Using a dataset of 80,053 Instagram direct messages donated by 26 adolescents aged 12-18, including youth with suicide risk factors, we first construct a human-labeled dataset of online harassment in private conversations and develop a context-aware cascading LLM classification pipeline. The proposed pipeline outperforms baseline toxicity classifiers trained primarily on public social media data. We then develop a victim-centered response framework that produces context-sensitive and psychologically-grounded AI-generated responses to online harassment messages. Human evaluators perceived the AI-generated responses as significantly more helpful than the original participant responses (95% CI: 0.767--0.815, p < .001), particularly in terms of emotional support and de-escalation. Our findings highlight the potential of context-aware and victim-centered AI systems to provide just-in-time support during harassment in private messaging environments.

翻译：网络霸凌是一种广泛存在的社会与公共健康问题，然而当前大多数用于检测和应对霸凌的计算方法主要集中在公开可见的社交媒体内容上，而非私人消息环境。私人对话因其上下文依赖、多轮交互的特性，使得有害互动往往在此类情境中逐步展开，而受害者在遭受霸凌时可能缺乏及时的支持。本研究探讨了大型语言模型如何在私人消息中支持网络霸凌的检测与回应。基于由26名12-18岁青少年（包括具有自杀风险因素的青少年）提供的80,053条Instagram私信数据集，我们首先构建了一个针对私人对话中网络霸凌的人工标注数据集，并开发了一套情境感知的级联LLM分类流程。所提流程的性能优于主要基于公开社交媒体数据训练的基础毒性分类器。随后，我们开发了一个以受害者为中心的回复生成框架，能够产生情境敏感且基于心理学的AI生成回复以应对网络霸凌消息。人工评估者认为AI生成的回复在情感支持与缓和冲突方面显著优于原始参与者回复（95%置信区间：0.767–0.815，p < .001）。研究结果凸显了情境感知与以受害者为中心的AI系统在私人消息环境中为霸凌事件提供即时支持的潜力。

0

相关内容

中文版 | 数字战场：人工智能如何作为主动防护盾对抗网络欺凌

中文版 | 数字战场：人工智能如何作为主动防护盾对抗网络欺凌

专知会员服务

10+阅读 · 2025年5月22日

《利用大型语言模型检测社交平台上的网络欺凌行为》

《利用大型语言模型检测社交平台上的网络欺凌行为》

专知会员服务

45+阅读 · 2024年1月23日

《从社交媒体上协调的敌对信息活动中预测集体暴力》2022.12最新103页论文

《从社交媒体上协调的敌对信息活动中预测集体暴力》2022.12最新103页论文

专知会员服务

31+阅读 · 2023年2月17日

【AI+军事】附论文《争取实现在线网络中依赖权威的风险识别和分析》德国比勒费尔德应用科学大学 "应用人工智能 "工作小组

【AI+军事】附论文《争取实现在线网络中依赖权威的风险识别和分析》德国比勒费尔德应用科学大学 "应用人工智能 "工作小组

专知会员服务

16+阅读 · 2022年4月27日

【AI+军事】附论文《从普通文本到网络威胁情报--利用自然语言处理收集网络威胁情报的技术解决方案》

【AI+军事】附论文《从普通文本到网络威胁情报--利用自然语言处理收集网络威胁情报的技术解决方案》

专知会员服务

65+阅读 · 2022年4月26日

【AI+军事】附论文《在半自动开源网络情报分析中跟踪网络威胁行为者》

【AI+军事】附论文《在半自动开源网络情报分析中跟踪网络威胁行为者》

专知会员服务

28+阅读 · 2022年4月26日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

社交网络中的虚假信息:定义、检测及控制

专知会员服务

28+阅读 · 2021年8月15日

最新《生成对抗网络:隐私与安全应用》综述论文

专知会员服务

48+阅读 · 2021年6月12日

网络攻击模型研究综述

专知会员服务

57+阅读 · 2020年12月28日

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

12+阅读 · 2022年10月28日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

94+阅读 · 2022年4月17日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

SMP 2019 第三届中文人机对话技术评测顺利落幕

SMP 2019 第三届中文人机对话技术评测顺利落幕

哈工大SCIR

12+阅读 · 2019年8月19日

网络舆情分析

网络舆情分析

计算机与网络安全

20+阅读 · 2018年10月18日

网络安全态势感知

网络安全态势感知

计算机与网络安全

26+阅读 · 2018年10月14日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

最新人机对话系统简略综述

最新人机对话系统简略综述

专知

26+阅读 · 2018年3月10日

综述——隐私保护集合交集计算技术研究

综述——隐私保护集合交集计算技术研究

计算机研究与发展

22+阅读 · 2017年10月24日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

移动互联网的用户隐私保护研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

移动社会网络中情境感知的多维个性化信任评价研究

国家自然科学基金

2+阅读 · 2015年12月31日

群体性突发事件预警的超网络方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

大数据环境下多媒体网络舆情信息的语义识别与危机响应研究

国家自然科学基金

4+阅读 · 2014年12月31日

大规模在线社会网络社区发现及隐私保护研究

国家自然科学基金

1+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

RoTRAG: Rule of Thumb Reasoning for Conversation Harm Detection with Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月15日

ChildGuard: A Specialized Dataset for Combatting Child-Targeted Hate Speech

Arxiv

0+阅读 · 6月14日

Benchmarking Knowledge-Extraction Attack and Defense on Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月8日

Understanding Human and Interface Design Factors in Canadian Cybercrime Reporting

Arxiv

0+阅读 · 6月5日

DPAgent-in-the-Middle: Agentic Defense and Repair Against AI-Groomed Deceptive Patterns

Arxiv

0+阅读 · 6月5日

Empathy on Demand: How Empathic AI Can Scale Emotional Support for Verbal Harassment

Arxiv

0+阅读 · 6月4日

Cognitive Threat Intelligence and Explainable Federated Security Analytics for distributed Infrastructure Systems

Arxiv

0+阅读 · 6月4日

reconCTI: A Proactive Approach to Cyber-Threat Intelligence

Arxiv

0+阅读 · 5月19日

Chinese Cyberbullying Detection: Dataset, Method, and Validation

Arxiv

0+阅读 · 5月11日

Attention: What Prevents Young Adults from Speaking Up Against Cyberbullying in an LLM-Powered Social Media Simulation

Arxiv

0+阅读 · 5月5日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

中文版 | 数字战场：人工智能如何作为主动防护盾对抗网络欺凌

中文版 | 数字战场：人工智能如何作为主动防护盾对抗网络欺凌

专知会员服务

10+阅读 · 2025年5月22日

《利用大型语言模型检测社交平台上的网络欺凌行为》

《利用大型语言模型检测社交平台上的网络欺凌行为》

专知会员服务

45+阅读 · 2024年1月23日

《从社交媒体上协调的敌对信息活动中预测集体暴力》2022.12最新103页论文

《从社交媒体上协调的敌对信息活动中预测集体暴力》2022.12最新103页论文

专知会员服务

31+阅读 · 2023年2月17日

【AI+军事】附论文《争取实现在线网络中依赖权威的风险识别和分析》德国比勒费尔德应用科学大学 "应用人工智能 "工作小组

【AI+军事】附论文《争取实现在线网络中依赖权威的风险识别和分析》德国比勒费尔德应用科学大学 "应用人工智能 "工作小组

专知会员服务

16+阅读 · 2022年4月27日

【AI+军事】附论文《从普通文本到网络威胁情报--利用自然语言处理收集网络威胁情报的技术解决方案》

【AI+军事】附论文《从普通文本到网络威胁情报--利用自然语言处理收集网络威胁情报的技术解决方案》

专知会员服务

65+阅读 · 2022年4月26日

【AI+军事】附论文《在半自动开源网络情报分析中跟踪网络威胁行为者》

【AI+军事】附论文《在半自动开源网络情报分析中跟踪网络威胁行为者》

专知会员服务

28+阅读 · 2022年4月26日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

社交网络中的虚假信息:定义、检测及控制

专知会员服务

28+阅读 · 2021年8月15日

最新《生成对抗网络:隐私与安全应用》综述论文

专知会员服务

48+阅读 · 2021年6月12日

网络攻击模型研究综述

专知会员服务

57+阅读 · 2020年12月28日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

12+阅读 · 2022年10月28日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

94+阅读 · 2022年4月17日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

SMP 2019 第三届中文人机对话技术评测顺利落幕

SMP 2019 第三届中文人机对话技术评测顺利落幕

哈工大SCIR

12+阅读 · 2019年8月19日

网络舆情分析

网络舆情分析

计算机与网络安全

20+阅读 · 2018年10月18日

网络安全态势感知

网络安全态势感知

计算机与网络安全

26+阅读 · 2018年10月14日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

最新人机对话系统简略综述

最新人机对话系统简略综述

专知

26+阅读 · 2018年3月10日

综述——隐私保护集合交集计算技术研究

综述——隐私保护集合交集计算技术研究

计算机研究与发展

22+阅读 · 2017年10月24日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

相关论文

RoTRAG: Rule of Thumb Reasoning for Conversation Harm Detection with Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月15日

ChildGuard: A Specialized Dataset for Combatting Child-Targeted Hate Speech

Arxiv

0+阅读 · 6月14日

Benchmarking Knowledge-Extraction Attack and Defense on Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月8日

Understanding Human and Interface Design Factors in Canadian Cybercrime Reporting

Arxiv

0+阅读 · 6月5日

DPAgent-in-the-Middle: Agentic Defense and Repair Against AI-Groomed Deceptive Patterns

Arxiv

0+阅读 · 6月5日

Empathy on Demand: How Empathic AI Can Scale Emotional Support for Verbal Harassment

Arxiv

0+阅读 · 6月4日

Cognitive Threat Intelligence and Explainable Federated Security Analytics for distributed Infrastructure Systems

Arxiv

0+阅读 · 6月4日

reconCTI: A Proactive Approach to Cyber-Threat Intelligence

Arxiv

0+阅读 · 5月19日

Chinese Cyberbullying Detection: Dataset, Method, and Validation

Arxiv

0+阅读 · 5月11日

Attention: What Prevents Young Adults from Speaking Up Against Cyberbullying in an LLM-Powered Social Media Simulation

Arxiv

0+阅读 · 5月5日

相关基金

移动互联网的用户隐私保护研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

移动社会网络中情境感知的多维个性化信任评价研究

国家自然科学基金

2+阅读 · 2015年12月31日

群体性突发事件预警的超网络方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

大数据环境下多媒体网络舆情信息的语义识别与危机响应研究

国家自然科学基金

4+阅读 · 2014年12月31日

大规模在线社会网络社区发现及隐私保护研究

国家自然科学基金

1+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员