替代性冒犯与冒犯性言论分类器的噪声审计：统一人类与机器对何为冒犯的分歧 (Vicarious Offense and Noise Audit of Offensive Speech Classifiers: Unifying Human and Machine Disagreement on What is Offensive) - 专知论文

会员服务 ·

0

噪声 · 分类器 · 数据集 · 社交 · GitHub ·

Vicarious Offense and Noise Audit of Offensive Speech Classifiers: Unifying Human and Machine Disagreement on What is Offensive

翻译：替代性冒犯与冒犯性言论分类器的噪声审计：统一人类与机器对何为冒犯的分歧

Tharindu Cyril Weerasooriya,Sujan Dutta,Tharindu Ranasinghe,Marcos Zampieri,Christopher M. Homan,Ashiqur R. KhudaBukhsh

from arxiv, Accepted at EMNLP 2023

Offensive speech detection is a key component of content moderation. However, what is offensive can be highly subjective. This paper investigates how machine and human moderators disagree on what is offensive when it comes to real-world social web political discourse. We show that (1) there is extensive disagreement among the moderators (humans and machines); and (2) human and large-language-model classifiers are unable to predict how other human raters will respond, based on their political leanings. For (1), we conduct a noise audit at an unprecedented scale that combines both machine and human responses. For (2), we introduce a first-of-its-kind dataset of vicarious offense. Our noise audit reveals that moderation outcomes vary wildly across different machine moderators. Our experiments with human moderators suggest that political leanings combined with sensitive issues affect both first-person and vicarious offense. The dataset is available through https://github.com/Homan-Lab/voiced.

翻译：冒犯性言论检测是内容审核的关键组成部分。然而，何为冒犯具有高度主观性。本文研究了在现实世界社交媒体政治话语中，机器与人类审核者对何为冒犯存在的分歧。我们表明：(1) 审核者（人类与机器）之间存在广泛的分歧；(2) 人类与大型语言模型分类器无法基于其政治倾向预测其他人类评分者将如何反应。针对(1)，我们以前所未有的规模进行了结合机器与人类响应的噪声审计。针对(2)，我们引入了首个替代性冒犯数据集。我们的噪声审计表明，不同机器审核者的审核结果差异巨大。我们针对人类审核者的实验表明，政治倾向与敏感议题相结合会影响第一人称冒犯与替代性冒犯。该数据集可通过 https://github.com/Homan-Lab/voiced 获取。

0

相关内容

《DIVERSE：基于视频评论立场分析解读互联网对美国军事的看法——立场分类的新基准数据集》最新论文

《DIVERSE：基于视频评论立场分析解读互联网对美国军事的看法——立场分类的新基准数据集》最新论文

专知会员服务

20+阅读 · 2024年3月18日

《利用大型语言模型检测社交平台上的网络欺凌行为》

《利用大型语言模型检测社交平台上的网络欺凌行为》

专知会员服务

44+阅读 · 2024年1月23日

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

专知会员服务

56+阅读 · 2023年10月16日

【IJCAI2023 教程】机器学习算法的审计偏见:工具和概述，113页pdf

【IJCAI2023 教程】机器学习算法的审计偏见:工具和概述，113页pdf

专知会员服务

24+阅读 · 2023年8月20日

《基于分类方法的自动人机对话》

《基于分类方法的自动人机对话》

专知会员服务

25+阅读 · 2023年7月18日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

社交网络中的虚假信息:定义、检测及控制

专知会员服务

28+阅读 · 2021年8月15日

虚假评论识别研究综述

专知会员服务

52+阅读 · 2021年1月19日

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

专知会员服务

38+阅读 · 2020年2月29日

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

专知会员服务

79+阅读 · 2020年2月12日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软丹棱街5号

19+阅读 · 2019年5月14日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

论文浅尝 | 基于局内去噪和迁移学习的关系抽取

论文浅尝 | 基于局内去噪和迁移学习的关系抽取

开放知识图谱

16+阅读 · 2018年12月2日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

Kaggle 恶意评论(toxic comment classification)分类 top 1 %方案

Kaggle 恶意评论(toxic comment classification)分类 top 1 %方案

AI研习社

11+阅读 · 2018年4月1日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

大数据环境下多媒体网络舆情信息的语义识别与危机响应研究

国家自然科学基金

4+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

负面在线评论和商家反馈对消费者个体态度和群体观点演化的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Beyond Binary Classification: Detecting Fine-Grained Sexism in Social Media Videos

Arxiv

0+阅读 · 2月17日

Cross-lingual Offensive Language Detection: A Systematic Review of Datasets, Transfer Approaches and Challenges

Arxiv

0+阅读 · 2月12日

Empirical Likelihood-Based Fairness Auditing: Distribution-Free Certification and Flagging

Arxiv

0+阅读 · 2月12日

Group-Adaptive Adversarial Learning for Robust Fake News Detection Against Malicious Comments

Arxiv

0+阅读 · 2月5日

Signal or 'Noise': Human Reactions to Robot Errors in the Wild

Arxiv

0+阅读 · 2月4日

Unheard in the Digital Age: Rethinking AI Bias and Speech Diversity

Arxiv

0+阅读 · 1月29日

Empirical Likelihood-Based Fairness Auditing: Distribution-Free Certification and Flagging

Arxiv

0+阅读 · 1月28日

Unheard in the Digital Age: Rethinking AI Bias and Speech Diversity

Arxiv

0+阅读 · 1月26日

UnWEIRDing Peer Review in Human Computer Interaction

Arxiv

0+阅读 · 1月24日

Multimodal Rumor Detection Enhanced by External Evidence and Forgery Features

Arxiv

0+阅读 · 1月21日

VIP会员

文章信息

相关主题

相关VIP内容

《DIVERSE：基于视频评论立场分析解读互联网对美国军事的看法——立场分类的新基准数据集》最新论文

《DIVERSE：基于视频评论立场分析解读互联网对美国军事的看法——立场分类的新基准数据集》最新论文

专知会员服务

20+阅读 · 2024年3月18日

《利用大型语言模型检测社交平台上的网络欺凌行为》

《利用大型语言模型检测社交平台上的网络欺凌行为》

专知会员服务

44+阅读 · 2024年1月23日

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

专知会员服务

56+阅读 · 2023年10月16日

【IJCAI2023 教程】机器学习算法的审计偏见:工具和概述，113页pdf

【IJCAI2023 教程】机器学习算法的审计偏见:工具和概述，113页pdf

专知会员服务

24+阅读 · 2023年8月20日

《基于分类方法的自动人机对话》

《基于分类方法的自动人机对话》

专知会员服务

25+阅读 · 2023年7月18日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

社交网络中的虚假信息:定义、检测及控制

专知会员服务

28+阅读 · 2021年8月15日

虚假评论识别研究综述

专知会员服务

52+阅读 · 2021年1月19日

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

专知会员服务

38+阅读 · 2020年2月29日

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

专知会员服务

79+阅读 · 2020年2月12日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软机器阅读理解在一场多轮对话挑战中媲美人类

微软丹棱街5号

19+阅读 · 2019年5月14日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

论文浅尝 | 基于局内去噪和迁移学习的关系抽取

论文浅尝 | 基于局内去噪和迁移学习的关系抽取

开放知识图谱

16+阅读 · 2018年12月2日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

Kaggle 恶意评论(toxic comment classification)分类 top 1 %方案

Kaggle 恶意评论(toxic comment classification)分类 top 1 %方案

AI研习社

11+阅读 · 2018年4月1日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

相关论文

Beyond Binary Classification: Detecting Fine-Grained Sexism in Social Media Videos

Arxiv

0+阅读 · 2月17日

Cross-lingual Offensive Language Detection: A Systematic Review of Datasets, Transfer Approaches and Challenges

Arxiv

0+阅读 · 2月12日

Empirical Likelihood-Based Fairness Auditing: Distribution-Free Certification and Flagging

Arxiv

0+阅读 · 2月12日

Group-Adaptive Adversarial Learning for Robust Fake News Detection Against Malicious Comments

Arxiv

0+阅读 · 2月5日

Signal or 'Noise': Human Reactions to Robot Errors in the Wild

Arxiv

0+阅读 · 2月4日

Unheard in the Digital Age: Rethinking AI Bias and Speech Diversity

Arxiv

0+阅读 · 1月29日

Empirical Likelihood-Based Fairness Auditing: Distribution-Free Certification and Flagging

Arxiv

0+阅读 · 1月28日

Unheard in the Digital Age: Rethinking AI Bias and Speech Diversity

Arxiv

0+阅读 · 1月26日

UnWEIRDing Peer Review in Human Computer Interaction

Arxiv

0+阅读 · 1月24日

Multimodal Rumor Detection Enhanced by External Evidence and Forgery Features

Arxiv

0+阅读 · 1月21日

相关基金

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

大数据环境下多媒体网络舆情信息的语义识别与危机响应研究

国家自然科学基金

4+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

负面在线评论和商家反馈对消费者个体态度和群体观点演化的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员