重构数据工作：作为女性主义实践的参与式标注工作坊 (Reimagining Data Work: Participatory Annotation Workshops as Feminist Practice) - 专知论文

会员服务 ·

0

标注 · 知识 · 数据标注 · 构建 · 人工智能系统 ·

Reimagining Data Work: Participatory Annotation Workshops as Feminist Practice

翻译：重构数据工作：作为女性主义实践的参与式标注工作坊

Yujia Gao,Isadora Araujo Cruxên,Helena Suárez Val,Alessandra Jungs de Almeida,Catherine D'Ignazio,Harini Suresh

from arxiv, Accepted to CHI 2026 (to appear)

AI systems depend on the invisible and undervalued labor of data workers, who are often treated as interchangeable units rather than collaborators with meaningful expertise. Critical scholars and practitioners have proposed alternative principles for data work, but few empirical studies examine how to enact them in practice. This paper bridges this gap through a case study of multilingual, iterative, and participatory data annotation processes with journalists and activists focused on news narratives of gender-related violence. We offer two methodological contributions. First, we demonstrate how workshops rooted in feminist epistemology can foster dialogue, build community, and disrupt knowledge hierarchies in data annotation. Second, drawing insights from practice, we deepen the analysis of existing feminist and participatory principles. We show that prioritizing context and pluralism in practice may require ``bounding'' context and working towards what we describe as a ``tactical consensus.'' We also explore tensions around materially acknowledging labor while resisting transactional researcher-participant dynamics. Through this work, we contribute to growing efforts to reimagine data and AI development as relational and political spaces for understanding difference, enacting care, and building solidarity across shared struggles.

翻译：人工智能系统依赖于数据工作者无形且被低估的劳动，这些工作者常被视为可互换的单元，而非具备实质专业知识的合作者。批判学者与实践者已提出数据工作的替代性原则，但鲜有实证研究探讨如何在实践中落实这些原则。本文通过一项聚焦性别暴力新闻叙事、与记者和活动家合作的多语言、迭代式参与式数据标注流程的案例研究，弥合了这一差距。我们提出两项方法论贡献：首先，我们展示了植根于女性主义认识论的工作坊如何能在数据标注中促进对话、构建社群并打破知识等级结构；其次，基于实践洞察，我们深化了对现有女性主义及参与式原则的分析。我们证明，在实践中优先考虑语境与多元性可能需要“界定”语境边界，并努力达成我们称之为“策略性共识”的目标。同时，我们探讨了在物质层面承认劳动价值与抵制交易式研究者-参与者动态之间的张力。通过此项工作，我们为日益增长的、将数据与人工智能开发重新构想为理解差异、践行关怀并在共同斗争中构建团结的关系性政治空间的努力作出贡献。

0

相关内容

《重新思考战斗人工智能和人类监督》

《重新思考战斗人工智能和人类监督》

专知会员服务

84+阅读 · 2024年5月5日

谷歌最新《大语言模型合成数据的最佳实践和经验教训》

谷歌最新《大语言模型合成数据的最佳实践和经验教训》

专知会员服务

66+阅读 · 2024年4月17日

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

专知会员服务

53+阅读 · 2023年2月27日

【牛津大学博士论文】关系数据的学习和推理，243页pdf

【牛津大学博士论文】关系数据的学习和推理，243页pdf

专知会员服务

54+阅读 · 2022年11月16日

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

专知会员服务

30+阅读 · 2022年6月16日

推荐！《预测与判断：为什么人工智能会增加人类在战争中的重要性》2022.2 MIT最新出版，附讲解PPT与video

推荐！《预测与判断：为什么人工智能会增加人类在战争中的重要性》2022.2 MIT最新出版，附讲解PPT与video

专知会员服务

81+阅读 · 2022年5月5日

推荐！牛津大学《AI增强律师职业》Augmented Lawyering，82页PDF

推荐！牛津大学《AI增强律师职业》Augmented Lawyering，82页PDF

专知会员服务

22+阅读 · 2022年4月1日

【ICLR 2022】MIT论文解读：谈到人工智能，我们可以抛弃数据集吗？基于ML创建合成数据，Generative Models As A Data Source For Multiview Representation Learning

【ICLR 2022】MIT论文解读：谈到人工智能，我们可以抛弃数据集吗？基于ML创建合成数据，Generative Models As A Data Source For Multiview Representation Learning

专知会员服务

41+阅读 · 2022年3月15日

数据标注研究综述，软件学报，19页pdf

数据标注研究综述，软件学报，19页pdf

专知会员服务

96+阅读 · 2020年2月20日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知会员服务

153+阅读 · 2019年10月18日

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

56+阅读 · 2022年6月2日

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

开放知识图谱

13+阅读 · 2022年3月8日

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

AINLP

27+阅读 · 2020年12月30日

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

专知

20+阅读 · 2020年2月28日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

放弃手工标记数据，斯坦福大学开发弱监督编程范式Snorkel

放弃手工标记数据，斯坦福大学开发弱监督编程范式Snorkel

新智元

14+阅读 · 2019年3月15日

【干货】理解特征工程Part 2——类别数据（附代码）

【干货】理解特征工程Part 2——类别数据（附代码）

专知

16+阅读 · 2018年6月8日

笔记 | Deep active learning for named entity recognition

笔记 | Deep active learning for named entity recognition

黑龙江大学自然语言处理实验室

24+阅读 · 2018年5月27日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

信息系统直接使用与间接使用—探索基于社会权力视角的前因及其对工作绩效的影响

国家自然科学基金

1+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

大数据环境下基于多源数据协同的个性化服务关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

Argument Reconstruction as Supervision for Critical Thinking in LLMs

Argument Reconstruction as Supervision for Critical Thinking in LLMs

Arxiv

0+阅读 · 3月18日

From Dyads to Groups: Rethinking Emotional Support with Conversational AI

Arxiv

0+阅读 · 2月28日

Relational Dissonance in Human-AI Interactions: The Case of Knowledge Work

Arxiv

0+阅读 · 2月27日

Stop Preaching and Start Practising Data Frugality for Responsible Development of AI

Arxiv

0+阅读 · 2月23日

Operational Agency: A Permeable Legal Fiction for Tracing Culpability in AI Systems

Arxiv

0+阅读 · 2月20日

From Labor to Collaboration: A Methodological Experiment Using AI Agents to Augment Research Perspectives in Taiwan's Humanities and Social Sciences

From Labor to Collaboration: A Methodological Experiment Using AI Agents to Augment Research Perspectives in Taiwan's Humanities and Social Sciences

Arxiv

0+阅读 · 2月19日

DataJoint 2.0: A Computational Substrate for Agentic Scientific Workflows

DataJoint 2.0: A Computational Substrate for Agentic Scientific Workflows

Arxiv

0+阅读 · 2月18日

Gender and Digital Platform Work During Turbulent Times

Arxiv

0+阅读 · 2月17日

Scaling Reproducibility: An AI-Assisted Workflow for Large-Scale Reanalysis

Arxiv

0+阅读 · 2月17日

End to End Collaborative Synthetic Data Generation

Arxiv

0+阅读 · 2月7日

VIP会员

文章信息

相关主题

人工智能系统

最新内容

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

专知会员服务

2+阅读 · 4月12日

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

专知会员服务

3+阅读 · 4月12日

最新“指挥控制”领域出版物合集（16份）

最新“指挥控制”领域出版物合集（16份）

专知会员服务

5+阅读 · 4月12日

面向军事作战需求开发的人工智能（RAIMOND）

面向军事作战需求开发的人工智能（RAIMOND）

专知会员服务

12+阅读 · 4月12日

检测算法战：一个识别军事行动中人工智能特征的框架

检测算法战：一个识别军事行动中人工智能特征的框架

专知会员服务

8+阅读 · 4月12日

软件定义多域战术网络：基础与未来方向（综述）

软件定义多域战术网络：基础与未来方向（综述）

专知会员服务

9+阅读 · 4月12日

水下战战术决策中的气象与海洋预报（50页报告）

水下战战术决策中的气象与海洋预报（50页报告）

专知会员服务

3+阅读 · 4月12日

远程空中优势：新一代超视距导弹的兴起

远程空中优势：新一代超视距导弹的兴起

专知会员服务

2+阅读 · 4月12日

大语言模型溯因推理的统一分类学与综述

大语言模型溯因推理的统一分类学与综述

专知会员服务

2+阅读 · 4月12日

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

专知会员服务

0+阅读 · 4月12日

大语言模型与国防战略：升级风险与国家安全挑战（综述）

大语言模型与国防战略：升级风险与国家安全挑战（综述）

专知会员服务

8+阅读 · 4月12日

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

专知会员服务

11+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第二部分

以机器速度作战：人工智能与美陆军反火力作战——第二部分

专知会员服务

9+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第一部分

以机器速度作战：人工智能与美陆军反火力作战——第一部分

专知会员服务

8+阅读 · 4月11日

大视觉语言模型的高效推理：瓶颈剖析、关键技术与未来展望

大视觉语言模型的高效推理：瓶颈剖析、关键技术与未来展望

专知会员服务

7+阅读 · 4月11日

相关VIP内容

《重新思考战斗人工智能和人类监督》

《重新思考战斗人工智能和人类监督》

专知会员服务

84+阅读 · 2024年5月5日

谷歌最新《大语言模型合成数据的最佳实践和经验教训》

谷歌最新《大语言模型合成数据的最佳实践和经验教训》

专知会员服务

66+阅读 · 2024年4月17日

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

专知会员服务

53+阅读 · 2023年2月27日

【牛津大学博士论文】关系数据的学习和推理，243页pdf

【牛津大学博士论文】关系数据的学习和推理，243页pdf

专知会员服务

54+阅读 · 2022年11月16日

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

最新综述论文《人类与人工智能交互中的信任：确定模型、措施和方法》东京工业大学

专知会员服务

30+阅读 · 2022年6月16日

推荐！《预测与判断：为什么人工智能会增加人类在战争中的重要性》2022.2 MIT最新出版，附讲解PPT与video

推荐！《预测与判断：为什么人工智能会增加人类在战争中的重要性》2022.2 MIT最新出版，附讲解PPT与video

专知会员服务

81+阅读 · 2022年5月5日

推荐！牛津大学《AI增强律师职业》Augmented Lawyering，82页PDF

推荐！牛津大学《AI增强律师职业》Augmented Lawyering，82页PDF

专知会员服务

22+阅读 · 2022年4月1日

【ICLR 2022】MIT论文解读：谈到人工智能，我们可以抛弃数据集吗？基于ML创建合成数据，Generative Models As A Data Source For Multiview Representation Learning

【ICLR 2022】MIT论文解读：谈到人工智能，我们可以抛弃数据集吗？基于ML创建合成数据，Generative Models As A Data Source For Multiview Representation Learning

专知会员服务

41+阅读 · 2022年3月15日

数据标注研究综述，软件学报，19页pdf

数据标注研究综述，软件学报，19页pdf

专知会员服务

96+阅读 · 2020年2月20日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知会员服务

153+阅读 · 2019年10月18日

热门VIP内容

开通专知VIP会员享更多权益服务

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

面向军事作战需求开发的人工智能（RAIMOND）

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

最新“指挥控制”领域出版物合集（16份）

相关资讯

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

《面向军事应用的数据驱动的行为建模》荷兰应用科学研究组织（NTO）

专知

56+阅读 · 2022年6月2日

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

开放知识图谱

13+阅读 · 2022年3月8日

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

AINLP

27+阅读 · 2020年12月30日

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

专知

20+阅读 · 2020年2月28日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

放弃手工标记数据，斯坦福大学开发弱监督编程范式Snorkel

放弃手工标记数据，斯坦福大学开发弱监督编程范式Snorkel

新智元

14+阅读 · 2019年3月15日

【干货】理解特征工程Part 2——类别数据（附代码）

【干货】理解特征工程Part 2——类别数据（附代码）

专知

16+阅读 · 2018年6月8日

笔记 | Deep active learning for named entity recognition

笔记 | Deep active learning for named entity recognition

黑龙江大学自然语言处理实验室

24+阅读 · 2018年5月27日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

相关论文

Argument Reconstruction as Supervision for Critical Thinking in LLMs

Argument Reconstruction as Supervision for Critical Thinking in LLMs

Arxiv

0+阅读 · 3月18日

From Dyads to Groups: Rethinking Emotional Support with Conversational AI

Arxiv

0+阅读 · 2月28日

Relational Dissonance in Human-AI Interactions: The Case of Knowledge Work

Arxiv

0+阅读 · 2月27日

Stop Preaching and Start Practising Data Frugality for Responsible Development of AI

Arxiv

0+阅读 · 2月23日

Operational Agency: A Permeable Legal Fiction for Tracing Culpability in AI Systems

Arxiv

0+阅读 · 2月20日

From Labor to Collaboration: A Methodological Experiment Using AI Agents to Augment Research Perspectives in Taiwan's Humanities and Social Sciences

From Labor to Collaboration: A Methodological Experiment Using AI Agents to Augment Research Perspectives in Taiwan's Humanities and Social Sciences

Arxiv

0+阅读 · 2月19日

DataJoint 2.0: A Computational Substrate for Agentic Scientific Workflows

DataJoint 2.0: A Computational Substrate for Agentic Scientific Workflows

Arxiv

0+阅读 · 2月18日

Gender and Digital Platform Work During Turbulent Times

Arxiv

0+阅读 · 2月17日

Scaling Reproducibility: An AI-Assisted Workflow for Large-Scale Reanalysis

Arxiv

0+阅读 · 2月17日

End to End Collaborative Synthetic Data Generation

Arxiv

0+阅读 · 2月7日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

信息系统直接使用与间接使用—探索基于社会权力视角的前因及其对工作绩效的影响

国家自然科学基金

1+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

大数据环境下基于多源数据协同的个性化服务关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员