Algorithms are increasingly used to automate or aid human decisions, yet recent research shows that these algorithms may exhibit bias across legally protected demographic groups. However, data on these groups may be unavailable to organizations or external auditors due to privacy legislation. This paper studies bias detection using an unsupervised bias detection tool when data on demographic groups are unavailable. We collaborated with the Dutch Executive Agency for Education to audit an algorithm that was used to assign risk scores to college students at the national level in the Netherlands between 2012-2023. Our audit covers more than 250,000 students across the country. The unsupervised bias detection tool highlights known disparities between students with a non-European migration background and students with a Dutch or European-migration background. Our contributions are two-fold: (1) we assess bias in a real-world, large-scale, and high-stakes decision-making process by a governmental organization; (2) we provide the unsupervised bias detection tool in an open-source library for others to use to complete bias audits. Our work serves as a starting point for a deliberative assessment by human experts to evaluate potential discrimination in algorithmic decision-making.


翻译:算法正日益被用于自动化或辅助人类决策,然而近期研究表明,这些算法可能在法律保护的特定人口群体间表现出偏差。但由于隐私法规限制,机构或外部审计方往往无法获取这些群体数据。本文研究了在缺乏人口群体数据时,如何利用无监督偏差检测工具进行偏差检测。我们与荷兰教育执行局合作,审计了该国2012至2023年间用于为全国大学生分配风险评分的算法。本次审计覆盖全国超过25万名学生。无监督偏差检测工具揭示了具有非欧洲移民背景的学生与具有荷兰或欧洲移民背景的学生之间已知的差异。我们的贡献包括两个方面:(1)对政府机构在现实世界、大规模、高风险决策过程中使用的算法进行偏差评估;(2)将无监督偏差检测工具开源发布,供其他研究者完成偏差审计。本工作为专家开展审议性评估、判断算法决策中潜在歧视问题提供了起点。

0
下载
关闭预览

相关内容

【MIT博士论文】序列决策中的算法公平性,134页pdf
专知会员服务
25+阅读 · 2023年5月20日
【ICDM 2022教程】图挖掘中的公平性:度量、算法和应用
专知会员服务
28+阅读 · 2022年12月26日
专知会员服务
24+阅读 · 2021年8月27日
【干货】Python无监督学习的4大聚类算法
新智元
14+阅读 · 2018年5月26日
边缘计算应用:传感数据异常实时检测算法
计算机研究与发展
11+阅读 · 2018年4月10日
【干货】监督学习与无监督学习简介
专知
14+阅读 · 2018年4月4日
实战|手把手教你实现图象边缘检测!
全球人工智能
10+阅读 · 2018年1月19日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
0+阅读 · 1月17日
VIP会员
相关VIP内容
【MIT博士论文】序列决策中的算法公平性,134页pdf
专知会员服务
25+阅读 · 2023年5月20日
【ICDM 2022教程】图挖掘中的公平性:度量、算法和应用
专知会员服务
28+阅读 · 2022年12月26日
专知会员服务
24+阅读 · 2021年8月27日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员