On Defining Erasure Harms for NLP - 专知论文

会员服务 ·

0

语言处理 · 情境 · 自然语言处理 · 系统 · 识别 ·

On Defining Erasure Harms for NLP

翻译：关于定义自然语言处理中的消除性伤害

Yu Lu Liu,Arnav Goel,Jackie Chi Kit Cheung,Alexandra Olteanu,Ziang Xiao,Su Lin Blodgett

The deployment of NLP systems has raised concerns about harms they might produce, including representational harms. Recent literature has begun to conceptualize and measure one such harm, the harm of erasure. Nevertheless, the field lacks a clear and cohesive conceptual foundation for identifying and measuring erasure. Existing conceptualizations of erasure are often broad -- making it difficult to identify what is needed to establish and measure erasure -- or else specific to particular settings -- facilitating measurement for those settings but potentially challenging to adapt to other settings. To address this gap, we develop and propose a structured definition of erasure that clarifies what components are necessary for establishing whether erasure has occurred, which practitioners need to explicitly articulate and operationalize in order to measure erasure.

翻译：自然语言处理系统的部署引发了对其可能产生的伤害的担忧，包括表征性伤害。近期文献开始概念化并衡量其中一种伤害，即消除性伤害。然而，该领域在识别和衡量消除性伤害方面缺乏清晰且连贯的概念基础。现有的消除性伤害概念化通常较为宽泛——这使得难以确定建立和衡量消除性伤害所需的内容——或者特定于特定情境——便于在这些情境下进行衡量，但可能难以适应其他情境。为填补这一空白，我们开发并提出了一种结构化的消除性伤害定义，明确了确立是否发生消除性伤害所必需的构成要素，这些要素需要从业者明确阐述和操作化，以便衡量消除性伤害。

0

相关内容

语言处理

自然语言处理中的探针可解释方法综述

自然语言处理中的探针可解释方法综述

专知会员服务

27+阅读 · 2024年8月1日

NLP中如何处理因果性？EMNLP2022最新《自然语言处理因果关系导论》教程，180页ppt全面讲解因果发现和因果效应估计

NLP中如何处理因果性？EMNLP2022最新《自然语言处理因果关系导论》教程，180页ppt全面讲解因果发现和因果效应估计

专知会员服务

67+阅读 · 2022年12月16日

自然语言处理中的文本表示研究

自然语言处理中的文本表示研究

专知会员服务

58+阅读 · 2022年1月10日

可解释的自然语言处理方法简介

专知会员服务

81+阅读 · 2021年5月30日

【复旦大学刘鹏飞博士论文】自然语言处理中的神经表示学习，153页pdf

专知会员服务

110+阅读 · 2020年9月1日

【新书】自然语言处理表示学习技术，349页pdf，清华大学

【新书】自然语言处理表示学习技术，349页pdf，清华大学

专知会员服务

174+阅读 · 2020年7月11日

自然语言处理中的注意力机制，Attention in Natural Language Processing

自然语言处理中的注意力机制，Attention in Natural Language Processing

专知会员服务

136+阅读 · 2020年5月30日

【新书】深度学习自然语言处理，Deep Learning for Natural Language Processing

【新书】深度学习自然语言处理，Deep Learning for Natural Language Processing

专知会员服务

67+阅读 · 2019年12月27日

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

专知会员服务

84+阅读 · 2019年11月20日

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

专知会员服务

26+阅读 · 2019年11月7日

自然语言处理NLP之旅（NLP文章/代码集锦）

自然语言处理NLP之旅（NLP文章/代码集锦）

专知

28+阅读 · 2019年8月6日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

自然语言处理NLP快速入门

自然语言处理NLP快速入门

专知

20+阅读 · 2018年10月8日

自然语言处理（NLP）知识结构总结

自然语言处理（NLP）知识结构总结

AI100

51+阅读 · 2018年8月17日

自然语言处理（NLP）数据集整理

自然语言处理（NLP）数据集整理

论智

20+阅读 · 2018年4月8日

从语言学到深度学习NLP，一文概述自然语言处理

从语言学到深度学习NLP，一文概述自然语言处理

人工智能学家

13+阅读 · 2018年1月28日

【NLP】十分钟快览自然语言处理学习总结

【NLP】十分钟快览自然语言处理学习总结

专知

17+阅读 · 2017年11月21日

【推荐】自然语言处理（NLP）指南

【推荐】自然语言处理（NLP）指南

机器学习研究会

35+阅读 · 2017年11月17日

Natural 自然语言处理（NLP）「全解析」

Natural 自然语言处理（NLP）「全解析」

人工智能学家

14+阅读 · 2017年9月23日

NLP（自然语言处理）扫盲

NLP（自然语言处理）扫盲

大数据和云计算技术

20+阅读 · 2017年7月9日

不可忽略缺失机制下的广义矩方法和调整经验似然方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

自我损耗对工作场所安全绩效的影响及缓解途径

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

自然灾害风险的时空尺度效应分析与推绎技术研究—以农业旱灾风险为例

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

基于潜在语义对偶空间的新词翻译自动识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

ForceForget: Reinforcement Concept Removal for Enhancing Safety in Text-to-Image Models

Arxiv

0+阅读 · 6月12日

Debiasing Without Protected Attributes: Latent Concept Erasure from Textual Profiles

Arxiv

0+阅读 · 6月10日

Erased but Not Forgotten: How Backdoors Compromise Concept Erasure

Arxiv

0+阅读 · 6月10日

Covert Influence Between Language Models

Arxiv

0+阅读 · 6月2日

Agentic Relationship Harm: Benchmarking and Gating Relational Manipulation in AI Agents

Arxiv

0+阅读 · 6月2日

The Illusion of Forgetting: Attack Unlearned Diffusion via Initial Latent Variable Optimization

Arxiv

0+阅读 · 5月7日

Implicit Representations of Grammaticality in Language Models

Arxiv

0+阅读 · 5月6日

Automatically Finding and Validating Unexpected Side-Effects of Interventions on Language Models

Arxiv

0+阅读 · 5月6日

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

Arxiv

0+阅读 · 4月4日

Interactive Natural Language Processing

Arxiv

12+阅读 · 2023年5月22日

VIP会员

文章信息

相关主题

自然语言处理

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

7+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

6+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

8+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

自然语言处理中的探针可解释方法综述

自然语言处理中的探针可解释方法综述

专知会员服务

27+阅读 · 2024年8月1日

NLP中如何处理因果性？EMNLP2022最新《自然语言处理因果关系导论》教程，180页ppt全面讲解因果发现和因果效应估计

NLP中如何处理因果性？EMNLP2022最新《自然语言处理因果关系导论》教程，180页ppt全面讲解因果发现和因果效应估计

专知会员服务

67+阅读 · 2022年12月16日

自然语言处理中的文本表示研究

自然语言处理中的文本表示研究

专知会员服务

58+阅读 · 2022年1月10日

可解释的自然语言处理方法简介

专知会员服务

81+阅读 · 2021年5月30日

【复旦大学刘鹏飞博士论文】自然语言处理中的神经表示学习，153页pdf

专知会员服务

110+阅读 · 2020年9月1日

【新书】自然语言处理表示学习技术，349页pdf，清华大学

【新书】自然语言处理表示学习技术，349页pdf，清华大学

专知会员服务

174+阅读 · 2020年7月11日

自然语言处理中的注意力机制，Attention in Natural Language Processing

自然语言处理中的注意力机制，Attention in Natural Language Processing

专知会员服务

136+阅读 · 2020年5月30日

【新书】深度学习自然语言处理，Deep Learning for Natural Language Processing

【新书】深度学习自然语言处理，Deep Learning for Natural Language Processing

专知会员服务

67+阅读 · 2019年12月27日

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

专知会员服务

84+阅读 · 2019年11月20日

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

【EMNLP 2019】Discreteness in Neural Natural Language Processing，神经自然语言处理中的离散性，附303页PPT免费下载

专知会员服务

26+阅读 · 2019年11月7日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

自然语言处理NLP之旅（NLP文章/代码集锦）

自然语言处理NLP之旅（NLP文章/代码集锦）

专知

28+阅读 · 2019年8月6日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

自然语言处理NLP快速入门

自然语言处理NLP快速入门

专知

20+阅读 · 2018年10月8日

自然语言处理（NLP）知识结构总结

自然语言处理（NLP）知识结构总结

AI100

51+阅读 · 2018年8月17日

自然语言处理（NLP）数据集整理

自然语言处理（NLP）数据集整理

论智

20+阅读 · 2018年4月8日

从语言学到深度学习NLP，一文概述自然语言处理

从语言学到深度学习NLP，一文概述自然语言处理

人工智能学家

13+阅读 · 2018年1月28日

【NLP】十分钟快览自然语言处理学习总结

【NLP】十分钟快览自然语言处理学习总结

专知

17+阅读 · 2017年11月21日

【推荐】自然语言处理（NLP）指南

【推荐】自然语言处理（NLP）指南

机器学习研究会

35+阅读 · 2017年11月17日

Natural 自然语言处理（NLP）「全解析」

Natural 自然语言处理（NLP）「全解析」

人工智能学家

14+阅读 · 2017年9月23日

NLP（自然语言处理）扫盲

NLP（自然语言处理）扫盲

大数据和云计算技术

20+阅读 · 2017年7月9日

相关论文

ForceForget: Reinforcement Concept Removal for Enhancing Safety in Text-to-Image Models

Arxiv

0+阅读 · 6月12日

Debiasing Without Protected Attributes: Latent Concept Erasure from Textual Profiles

Arxiv

0+阅读 · 6月10日

Erased but Not Forgotten: How Backdoors Compromise Concept Erasure

Arxiv

0+阅读 · 6月10日

Covert Influence Between Language Models

Arxiv

0+阅读 · 6月2日

Agentic Relationship Harm: Benchmarking and Gating Relational Manipulation in AI Agents

Arxiv

0+阅读 · 6月2日

The Illusion of Forgetting: Attack Unlearned Diffusion via Initial Latent Variable Optimization

Arxiv

0+阅读 · 5月7日

Implicit Representations of Grammaticality in Language Models

Arxiv

0+阅读 · 5月6日

Automatically Finding and Validating Unexpected Side-Effects of Interventions on Language Models

Arxiv

0+阅读 · 5月6日

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

Arxiv

0+阅读 · 4月4日

Interactive Natural Language Processing

Arxiv

12+阅读 · 2023年5月22日

相关基金

不可忽略缺失机制下的广义矩方法和调整经验似然方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

自我损耗对工作场所安全绩效的影响及缓解途径

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

自然灾害风险的时空尺度效应分析与推绎技术研究—以农业旱灾风险为例

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

基于潜在语义对偶空间的新词翻译自动识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员