Fairness audits of institutional risk models are critical for understanding how deployed machine learning pipelines allocate resources. Drawing on multi-year collaboration with Centennial College, where our prior ethnographic work introduced the ASP-HEI Cycle, we present a replica-based audit of a deployed Early Warning System (EWS), replicating its model using institutional training data and design specifications. We evaluate disparities by gender, age, and residency status across the full pipeline (training data, model predictions, and post-processing) using standard fairness metrics. Our audit reveals systematic misallocation: younger, male, and international students are disproportionately flagged for support, even when many ultimately succeed, while older and female students with comparable dropout risk are under-identified. Post-processing amplifies these disparities by collapsing heterogeneous probabilities into percentile-based risk tiers. This work provides a replicable methodology for auditing institutional ML systems and shows how disparities emerge and compound across stages, highlighting the importance of evaluating construct validity alongside statistical fairness. It contributes one empirical thread to a broader program investigating algorithms, student data, and power in higher education.


翻译:机构风险模型的公平性审计对于理解已部署机器学习流水线如何分配资源至关重要。基于与世纪学院多年合作(前期民族志研究引入了ASP-HEI循环),我们提出对已部署的早期预警系统进行基于复制的审计——使用机构训练数据和设计规格复现其模型。我们采用标准公平性指标评估整个流水线(训练数据、模型预测和后处理阶段)中由性别、年龄和居住状态导致的差异。审计揭示了系统性资源错配:年轻、男性及国际学生被不成比例地标记为需要支持(即便许多人最终成功毕业),而具有相似辍学风险的较大龄及女性学生则被低估识别。后处理阶段通过将异质性概率压缩为百分位风险等级进一步放大了这些差异。本研究为审计机构机器学习系统提供了可复现的方法论,并展示了差异如何在各阶段产生与累积,强调了评估结构效度与统计公平性并重的重要性。该工作为探讨算法、学生数据与高等教育权力关系的更宏观研究计划提供了一条实证脉络。

0
下载
关闭预览

相关内容

《运用人工神经网络的防空系统威胁评估模型》
专知会员服务
16+阅读 · 2月21日
面向机器学习模型安全的测试与修复
专知会员服务
54+阅读 · 2023年2月5日
图机器学习在蚂蚁集团安全风控场景的应用
专知会员服务
40+阅读 · 2022年10月7日
可信机器学习的公平性综述
专知会员服务
69+阅读 · 2021年2月23日
以BERT为例,如何优化机器学习模型性能?
专知
10+阅读 · 2019年10月3日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
用机器学习来预测股价(代码+文档)——2018年iNTUtion决赛大作!
量化投资与机器学习
25+阅读 · 2018年11月20日
腾讯:机器学习构建通用的数据异常检测平台
全球人工智能
11+阅读 · 2018年5月1日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
推荐|TensorFlow/PyTorch/Sklearn实现的五十种机器学习模型
全球人工智能
24+阅读 · 2017年7月14日
机器学习实现金融风控
凡人机器学习
15+阅读 · 2017年6月1日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
18+阅读 · 2019年1月16日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
3+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关资讯
以BERT为例,如何优化机器学习模型性能?
专知
10+阅读 · 2019年10月3日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
用机器学习来预测股价(代码+文档)——2018年iNTUtion决赛大作!
量化投资与机器学习
25+阅读 · 2018年11月20日
腾讯:机器学习构建通用的数据异常检测平台
全球人工智能
11+阅读 · 2018年5月1日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
推荐|TensorFlow/PyTorch/Sklearn实现的五十种机器学习模型
全球人工智能
24+阅读 · 2017年7月14日
机器学习实现金融风控
凡人机器学习
15+阅读 · 2017年6月1日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员