Researchers have proposed many methods for fair and robust machine learning, but comprehensive empirical evaluation of their subgroup robustness is lacking. In this work, we address this gap in the context of tabular data, where sensitive subgroups are clearly-defined, real-world fairness problems abound, and prior works often do not compare to state-of-the-art tree-based models as baselines. We conduct an empirical comparison of several previously-proposed methods for fair and robust learning alongside state-of-the-art tree-based methods and other baselines. Via experiments with more than $340{,}000$ model configurations on eight datasets, we show that tree-based methods have strong subgroup robustness, even when compared to robustness- and fairness-enhancing methods. Moreover, the best tree-based models tend to show good performance over a range of metrics, while robust or group-fair models can show brittleness, with significant performance differences across different metrics for a fixed model. We also demonstrate that tree-based models show less sensitivity to hyperparameter configurations, and are less costly to train. Our work suggests that tree-based ensemble models make an effective baseline for tabular data, and are a sensible default when subgroup robustness is desired. For associated code and detailed results, see https://github.com/jpgard/subgroup-robustness-grows-on-trees .


翻译:研究者提出了许多公平且鲁棒的机器学习方法,但对其子群鲁棒性的全面实证评估仍较为缺乏。本研究针对表格数据填补了这一空白,在此类数据中敏感子群定义明确、现实公平性问题普遍存在,且以往工作常未将最先进的基于树的模型作为基线进行比较。我们通过实证比较了多种先前提出的公平鲁棒学习方法,以及最先进的基于树的方法和其他基线。通过超过34万个模型配置在八个数据集上的实验,我们证明基于树的方法具有强大的子群鲁棒性,即便与针对鲁棒性和公平性的增强方法相比也是如此。此外,最佳树模型往往在多种指标上表现良好,而鲁棒模型或群组公平模型可能表现出脆弱性,对于固定模型,其在不同指标上的性能存在显著差异。我们还证明,基于树的模型对超参数配置的敏感性较低,且训练成本更小。我们的研究表明,基于树的集成模型可作为表格数据的有效基线,并且当需要子群鲁棒性时,它们是一个合理默认选择。相关代码和详细结果详见 https://github.com/jpgard/subgroup-robustness-grows-on-trees 。

0
下载
关闭预览

相关内容

不可错过!《机器学习100讲》课程,UBC Mark Schmidt讲授
专知会员服务
76+阅读 · 2022年6月28日
【ICLR2021】神经元注意力蒸馏消除DNN中的后门触发器
专知会员服务
15+阅读 · 2021年1月31日
专知会员服务
26+阅读 · 2021年1月21日
GNN 新基准!Long Range Graph Benchmark
图与推荐
0+阅读 · 2022年10月18日
VCIP 2022 Call for Demos
CCF多媒体专委会
1+阅读 · 2022年6月6日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月30日
Arxiv
27+阅读 · 2020年6月19日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
0+阅读 · 17分钟前
综述 | 世界动作模型:少做梦,多行动
专知会员服务
0+阅读 · 19分钟前
美以伊冲突:无人机与人工智能的运用
专知会员服务
1+阅读 · 31分钟前
《特种部队在透明战场中的生存力》最新报告
专知会员服务
1+阅读 · 51分钟前
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员