Data equity is an emerging framework for responsible data science. However, its core concepts, including fairness, representativeness, and information bias, remain largely abstract and general, lacking the mathematical specificity needed for practical implementation. In this paper, we demonstrate how statisticians can operationalize data equity by translating its tenets into precise, testable formulations tailored to a given problem. Using the well-documented case of differential measurement error across racial groups in pulse oximetry, we first adopt an oracle approach, tracing how a single upstream violation of information bias compounds through the analytic pipeline into treatment disparities, fairness violations, and adverse health outcomes. We then demonstrate the inverse: starting from an observed outcome disparity, the data equity framework provides a principled structure for systematically identifying its statistical sources. Our exposition reveals that data equity, prediction equity, and decision equity are distinct requirements with distinct evaluation and policy needs--a nuance that highlights both the unique role of statisticians in the era of artificial intelligence as well as the necessity of interdisciplinary collaboration.


翻译:数据公平性是负责任数据科学的新兴框架。然而,其核心概念,包括公平性、代表性和信息偏差,在很大程度上仍停留在抽象和一般层面,缺乏实践所需的具体数学形式。本文展示了统计学家如何通过将数据公平性原则转化为针对特定问题的、精确且可检验的数学公式来实现其可操作性。以脉搏血氧测定中跨种族群体差异化测量误差这一充分记录的案例为基础,我们首先采用先验方法,追溯上游单一的信息偏差违反如何通过分析流程复合为治疗差异、公平性违反及不良健康结果。随后,我们演示逆向过程:从观察到的结果差异出发,数据公平性框架为系统性识别其统计来源提供了原则性结构。我们的论述表明,数据公平性、预测公平性与决策公平性是具有不同评估与政策需求的不同要求——这一细微差别既凸显了统计学家在人工智能时代的独特作用,也强调了跨学科合作的必要性。

0
下载
关闭预览

相关内容

【新书】数据科学中的因果推断,638页pdf
专知会员服务
80+阅读 · 2025年2月19日
不平衡数据学习的全面综述
专知会员服务
44+阅读 · 2025年2月15日
数据科学平台:特征、技术及趋势
专知会员服务
46+阅读 · 2022年4月17日
可信机器学习的公平性综述
专知会员服务
69+阅读 · 2021年2月23日
专知会员服务
66+阅读 · 2021年1月6日
【硬核书】数据科学,282页pdf
专知
26+阅读 · 2022年11月29日
【干货书】数据科学手册,456页pdf
专知
15+阅读 · 2021年4月28日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
机器学习中如何处理不平衡数据?
机器之心
13+阅读 · 2019年2月17日
统计学常用数据类型
论智
19+阅读 · 2018年7月6日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2月27日
VIP会员
相关主题
最新内容
重新思考无人机时代的生存能力
专知会员服务
3+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
3+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
4+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
4+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
5+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员