We study discrete k-clustering problems in general metric spaces that are constrained by a combination of two different fairness conditions within the demographic fairness model. Given a metric space (P,d), where every point in P is equipped with a protected attribute, and a number k, the goal is to partition P into k clusters with a designated center each, such that a center-based objective function is minimized and the attributes are fairly distributed with respect to the following two fairness concepts: 1) group fairness: We aim for clusters with balanced numbers of attributes by specifying lower and upper bounds for the desired attribute proportions. 2) diverse center selection: Clusters have natural representatives, i.e., their centers. We ask for a balanced set of representatives by specifying the desired number of centers to choose from each attribute. Dickerson, Esmaeili, Morgenstern and Zhang (2023) denote the combination of these two constraints as doubly constrained fair clustering. They present algorithms whose guarantees depend on the best known approximation factors for either of these problems. Currently, this implies an 8-approximation with a small additive violation on the group fairness constraint. For k-center, we improve this approximation factor to 4 with a small additive violation. This guarantee also depends on the currently best algorithm for DS-fair k-center given by Jones, Nguyen and Nguyen (2020). For k-median and k-means, we propose the first constant-factor approximation algorithms. Our algorithms transform a solution that satisfies diverse center selection into a doubly constrained fair clustering using an LP-based approach. Furthermore, our results are generalizable to other center-selection constraints, such as matroid k-clustering and knapsack constraints.


翻译:我们研究一般度量空间中受人口统计公平模型内两种不同公平条件联合约束的离散k-聚类问题。给定度量空间(P,d),其中每个点都配备一个受保护属性,以及一个整数k,目标是将P划分为k个簇(每个簇指定一个中心),使得基于中心的代价函数最小化,且属性按照以下两种公平概念实现公平分布:1) 群体公平:通过指定期望属性比例的下界和上界,追求各簇中属性数量的平衡。2) 多样化中心选择:簇具有自然代表(即中心)。我们要求通过指定从每个属性中选择的期望中心数量,获得平衡的代表集。Dickerson、Esmaeili、Morgenstern和Zhang (2023)将这两种约束的组合称为双重约束公平聚类。他们提出的算法保证依赖于这两个问题中已知最佳近似因子。目前,这给出了一个8-近似算法,在群体公平约束上存在微小加法违规。对于k-中心问题,我们将近似因子改进为4,同时保持微小加法违规。该保证还依赖于Jones、Nguyen和Nguyen (2020)提出的DS-公平k-中心最佳算法。对于k-中位数和k-均值问题,我们首次提出常数因子近似算法。我们的算法通过基于线性规划的方法,将满足多样化中心选择的解转化为双重约束公平聚类。此外,我们的结果可推广至其他中心选择约束,如拟阵k-聚类和背包约束。

0
下载
关闭预览

相关内容

NeurIPS 2021 Spotlight | 针对有缺失坐标的聚类问题的核心集
专知会员服务
16+阅读 · 2021年11月27日
专知会员服务
15+阅读 · 2021年8月29日
专知会员服务
24+阅读 · 2021年8月27日
pytorch中六种常用的向量相似度评估方法
极市平台
22+阅读 · 2021年12月9日
【AAAI2021】对比聚类,Contrastive Clustering
专知
26+阅读 · 2021年1月30日
常见的距离算法和相似度计算方法
极市平台
18+阅读 · 2020年7月31日
计算文本相似度常用的四种方法
论智
33+阅读 · 2018年5月18日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
机器学习之确定最佳聚类数目的10种方法
炼数成金订阅号
13+阅读 · 2017年10月12日
各种相似性度量及Python实现
机器学习算法与Python学习
11+阅读 · 2017年7月6日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
0+阅读 · 17分钟前
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
相关VIP内容
NeurIPS 2021 Spotlight | 针对有缺失坐标的聚类问题的核心集
专知会员服务
16+阅读 · 2021年11月27日
专知会员服务
15+阅读 · 2021年8月29日
专知会员服务
24+阅读 · 2021年8月27日
相关资讯
pytorch中六种常用的向量相似度评估方法
极市平台
22+阅读 · 2021年12月9日
【AAAI2021】对比聚类,Contrastive Clustering
专知
26+阅读 · 2021年1月30日
常见的距离算法和相似度计算方法
极市平台
18+阅读 · 2020年7月31日
计算文本相似度常用的四种方法
论智
33+阅读 · 2018年5月18日
干货 :基于用户画像的聚类分析
数据分析
22+阅读 · 2018年5月17日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
机器学习之确定最佳聚类数目的10种方法
炼数成金订阅号
13+阅读 · 2017年10月12日
各种相似性度量及Python实现
机器学习算法与Python学习
11+阅读 · 2017年7月6日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员