Why AI Harms Can't Be Fixed One Identity at a Time: What 5300 Incident Reports Reveal About Intersectionality - 专知论文

会员服务 ·

0

Why AI Harms Can't Be Fixed One Identity at a Time: What 5300 Incident Reports Reveal About Intersectionality

翻译：为什么人工智能的危害无法逐一身份类别修复：5300份事件报告揭示的交叉性

Edyta Bogucka,Sanja Šćepanović,Daniele Quercia

from arxiv, 29 pages, 7 figures

AI risk assessment is the primary tool for identifying harms caused by AI systems. These include intersectional harms, which arise from the interaction between identity categories (e.g., class and skin tone) and which do not occur, or occur differently, when those categories are considered separately. Yet existing AI risk assessments are still built around isolated identity categories, and when intersections are considered, they focus almost exclusively on race and gender. Drawing on a large-scale analysis of documented AI incidents, we show that AI harms do not occur one identity category at a time. Using a structured rubric applied with a Large Language Model (LLM), we analyze 5,300 reports from 1,200 documented incidents in the AI Incident Database, the most curated source of incident data. From these reports, we identify 1,513 harmed subjects and their associated identity categories, achieving 98% accuracy. At the level of individual categories, we find that age and political identity appear in documented AI harms at rates comparable to race and gender. At the level of intersecting categories, harm is amplified up to three times at specific intersections: adolescent girls, lower-class people of color, and upper-class political elites. We argue that intersectionality should be a core component of AI risk assessment to more accurately capture how harms are produced and distributed across social groups.

翻译：人工智能风险评估是识别AI系统所造成危害的主要工具。这些危害包括交叉性危害，它们源于身份类别（例如阶级与肤色）之间的相互作用，当这些类别被单独考虑时，此类危害不会发生或以不同方式发生。然而，现有的人工智能风险评估仍围绕孤立的身份类别构建，即使考虑交叉性，也几乎仅聚焦于种族和性别。基于对已记录AI事件的大规模分析，我们表明人工智能的危害不会一次仅涉及一个身份类别。我们利用一套结构化评估准则并借助大型语言模型（LLM），从AI事件数据库中（最严谨的事件数据来源）1,200个已记录事件中分析5,300份报告。从这些报告中，我们识别出1,513个受害主体及其相关的身份类别，准确率达到98%。在单一类别层面，我们发现年龄和政治身份在已记录AI危害中出现频率与种族和性别相当。在交叉类别层面，特定交叉点（如青少年女性、下层有色人种、上层政治精英）的危害程度最高可放大三倍。我们主张交叉性应成为人工智能风险评估的核心组成部分，以更准确地捕捉危害如何产生并在社会群体间分布。

0

相关内容

《人工智能绝不能完全自主》

《人工智能绝不能完全自主》

专知会员服务

29+阅读 · 2025年8月4日

《人工智能对网络安全的影响：攻防平衡的转变》46页报告

《人工智能对网络安全的影响：攻防平衡的转变》46页报告

专知会员服务

24+阅读 · 2025年4月13日

《评估人工智能的风险和影响（ARIA》美国国家标准与技术研究院最新报告

《评估人工智能的风险和影响（ARIA》美国国家标准与技术研究院最新报告

专知会员服务

22+阅读 · 2025年1月6日

《人类-人工智能安全：生成式人工智能和控制系统安全的后继者》

《人类-人工智能安全：生成式人工智能和控制系统安全的后继者》

专知会员服务

43+阅读 · 2024年5月27日

《人工智能：问责政策报告》最新77页，美国国家电信和信息管理局(NTIA)

《人工智能：问责政策报告》最新77页，美国国家电信和信息管理局(NTIA)

专知会员服务

24+阅读 · 2024年5月3日

《人工智能灾难性风险概述》2023最新55页报告

《人工智能灾难性风险概述》2023最新55页报告

专知会员服务

69+阅读 · 2023年10月6日

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

专知会员服务

48+阅读 · 2023年7月23日

人工智能的安全性，公平性，可问责性，透明度，一致性，77页ppt

人工智能的安全性，公平性，可问责性，透明度，一致性，77页ppt

专知会员服务

51+阅读 · 2023年5月1日

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

专知会员服务

21+阅读 · 2022年3月14日

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

专知会员服务

107+阅读 · 2021年10月6日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

91+阅读 · 2022年4月17日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

中国人工智能产业知识产权白皮书（2021）（附报告），519页pdf

中国人工智能产业知识产权白皮书（2021）（附报告），519页pdf

专知

11+阅读 · 2022年2月12日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

专知

28+阅读 · 2019年12月13日

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

专知

18+阅读 · 2019年1月20日

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

机器之心

16+阅读 · 2018年7月9日

人工智能对网络空间安全的影响

人工智能对网络空间安全的影响

走向智能论坛

21+阅读 · 2018年6月7日

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

AI100

11+阅读 · 2017年11月17日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于社交网络的安全性身份认证的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向生物威胁快速反应的大数据分析关键技术

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

The Homogenization Problem in LLMs: Towards Meaningful Diversity in AI Safety

The Homogenization Problem in LLMs: Towards Meaningful Diversity in AI Safety

Arxiv

0+阅读 · 5月4日

Agentic Microphysics: A Manifesto for Generative AI Safety

Arxiv

0+阅读 · 4月16日

Human Agency, Causality, and the Human Computer Interface in High-Stakes Artificial Intelligence

Arxiv

0+阅读 · 4月14日

Designing Incident Reporting Systems for Harms from General-Purpose AI

Arxiv

0+阅读 · 4月14日

Latent Profiles of AI Risk Perception and Their Differential Association with Community Driving Safety Concerns: A Person-Centered Analysis

Arxiv

0+阅读 · 4月6日

Security Barriers to Trustworthy AI-Driven Cyber Threat Intelligence in Finance: Evidence from Practitioners

Arxiv

0+阅读 · 3月24日

Evasive Intelligence: Lessons from Malware Analysis for Evaluating AI Agents

Arxiv

0+阅读 · 3月16日

Bridging the Gap in the Responsible AI Divides

Arxiv

0+阅读 · 3月15日

Questionnaire Responses Do not Capture the Safety of AI Agents

Arxiv

0+阅读 · 3月15日

Identifying, Explaining, and Correcting Ableist Language with AI

Arxiv

0+阅读 · 2月23日

VIP会员

文章信息

相关主题

最新内容

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

专知会员服务

1+阅读 · 今天1:36

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

专知会员服务

1+阅读 · 今天1:28

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

专知会员服务

1+阅读 · 今天1:16

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

专知会员服务

1+阅读 · 5月8日

生成-过滤-控制-重放：LLM强化学习中Rollout策略的全面综述

生成-过滤-控制-重放：LLM强化学习中Rollout策略的全面综述

专知会员服务

0+阅读 · 5月8日

认知战与交战性质的改变：神经战略视角

认知战与交战性质的改变：神经战略视角

专知会员服务

5+阅读 · 5月8日

美国《国防授权法案》指令要求界定“认知战”：区分相关概念

美国《国防授权法案》指令要求界定“认知战”：区分相关概念

专知会员服务

4+阅读 · 5月8日

人工智能对特定国防资源管理流程的影响（万字长文）

人工智能对特定国防资源管理流程的影响（万字长文）

专知会员服务

5+阅读 · 5月8日

《多域作战概念实证检验：美军“史诗怒火”行动中跨域协同的地理空间混合方法分析研究》245页报告

《多域作战概念实证检验：美军“史诗怒火”行动中跨域协同的地理空间混合方法分析研究》245页报告

专知会员服务

7+阅读 · 5月8日

《预设时间的单次协同估计、制导与控制框架：实现同时目标拦截》2026最新40页报告

《预设时间的单次协同估计、制导与控制框架：实现同时目标拦截》2026最新40页报告

专知会员服务

10+阅读 · 5月8日

《美空军条令出版物：网络空间作战（2026版）》

《美空军条令出版物：网络空间作战（2026版）》

专知会员服务

11+阅读 · 5月8日

《美空军条令出版物：空军作战中的信息（2026版）》

《美空军条令出版物：空军作战中的信息（2026版）》

专知会员服务

13+阅读 · 5月8日

为指挥控制与防御构建智能网络结构：集成感知与通信以提升频谱利用率

为指挥控制与防御构建智能网络结构：集成感知与通信以提升频谱利用率

专知会员服务

9+阅读 · 5月8日

人工智能如何变革军事C5ISR作战

人工智能如何变革军事C5ISR作战

专知会员服务

12+阅读 · 5月8日

《自主空中加油：用于相对导航与自主对接的双向多目标检测系统》97页

《自主空中加油：用于相对导航与自主对接的双向多目标检测系统》97页

专知会员服务

8+阅读 · 5月8日

相关VIP内容

《人工智能绝不能完全自主》

《人工智能绝不能完全自主》

专知会员服务

29+阅读 · 2025年8月4日

《人工智能对网络安全的影响：攻防平衡的转变》46页报告

《人工智能对网络安全的影响：攻防平衡的转变》46页报告

专知会员服务

24+阅读 · 2025年4月13日

《评估人工智能的风险和影响（ARIA》美国国家标准与技术研究院最新报告

《评估人工智能的风险和影响（ARIA》美国国家标准与技术研究院最新报告

专知会员服务

22+阅读 · 2025年1月6日

《人类-人工智能安全：生成式人工智能和控制系统安全的后继者》

《人类-人工智能安全：生成式人工智能和控制系统安全的后继者》

专知会员服务

43+阅读 · 2024年5月27日

《人工智能：问责政策报告》最新77页，美国国家电信和信息管理局(NTIA)

《人工智能：问责政策报告》最新77页，美国国家电信和信息管理局(NTIA)

专知会员服务

24+阅读 · 2024年5月3日

《人工智能灾难性风险概述》2023最新55页报告

《人工智能灾难性风险概述》2023最新55页报告

专知会员服务

69+阅读 · 2023年10月6日

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

专知会员服务

48+阅读 · 2023年7月23日

人工智能的安全性，公平性，可问责性，透明度，一致性，77页ppt

人工智能的安全性，公平性，可问责性，透明度，一致性，77页ppt

专知会员服务

51+阅读 · 2023年5月1日

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

AI 模型偏差对信任的损害可能超出你的想象，该如何解决？（附报告）

专知会员服务

21+阅读 · 2022年3月14日

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

专知会员服务

107+阅读 · 2021年10月6日

热门VIP内容

开通专知VIP会员享更多权益服务

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

相关资讯

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

91+阅读 · 2022年4月17日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

中国人工智能产业知识产权白皮书（2021）（附报告），519页pdf

中国人工智能产业知识产权白皮书（2021）（附报告），519页pdf

专知

11+阅读 · 2022年2月12日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

专知

28+阅读 · 2019年12月13日

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

专知

18+阅读 · 2019年1月20日

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

综述 | 一文看尽三种针对人工智能系统的攻击技术及防御策略

机器之心

16+阅读 · 2018年7月9日

人工智能对网络空间安全的影响

人工智能对网络空间安全的影响

走向智能论坛

21+阅读 · 2018年6月7日

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

AI100

11+阅读 · 2017年11月17日

相关论文

The Homogenization Problem in LLMs: Towards Meaningful Diversity in AI Safety

The Homogenization Problem in LLMs: Towards Meaningful Diversity in AI Safety

Arxiv

0+阅读 · 5月4日

Agentic Microphysics: A Manifesto for Generative AI Safety

Arxiv

0+阅读 · 4月16日

Human Agency, Causality, and the Human Computer Interface in High-Stakes Artificial Intelligence

Arxiv

0+阅读 · 4月14日

Designing Incident Reporting Systems for Harms from General-Purpose AI

Arxiv

0+阅读 · 4月14日

Latent Profiles of AI Risk Perception and Their Differential Association with Community Driving Safety Concerns: A Person-Centered Analysis

Arxiv

0+阅读 · 4月6日

Security Barriers to Trustworthy AI-Driven Cyber Threat Intelligence in Finance: Evidence from Practitioners

Arxiv

0+阅读 · 3月24日

Evasive Intelligence: Lessons from Malware Analysis for Evaluating AI Agents

Arxiv

0+阅读 · 3月16日

Bridging the Gap in the Responsible AI Divides

Arxiv

0+阅读 · 3月15日

Questionnaire Responses Do not Capture the Safety of AI Agents

Arxiv

0+阅读 · 3月15日

Identifying, Explaining, and Correcting Ableist Language with AI

Arxiv

0+阅读 · 2月23日

相关基金

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于社交网络的安全性身份认证的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向生物威胁快速反应的大数据分析关键技术

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员