Spectral clustering has emerged as one of the most effective clustering algorithms due to its superior performance. However, most existing models are designed for centralized settings, rendering them inapplicable in modern decentralized environments. Moreover, current federated learning approaches often suffer from poor generalization performance due to reliance on unreliable pseudo-labels, and fail to capture the latent correlations amongst heterogeneous clients. To tackle these limitations, this paper proposes a novel framework named Federated Multi-Task Clustering (i.e.,FMTC), which intends to learn personalized clustering models for heterogeneous clients while collaboratively leveraging their shared underlying structure in a privacy-preserving manner. More specifically, the FMTC framework is composed of two main components: client-side personalized clustering module, which learns a parameterized mapping model to support robust out-of-sample inference, bypassing the need for unreliable pseudo-labels; and server-side tensorial correlation module, which explicitly captures the shared knowledge across all clients. This is achieved by organizing all client models into a unified tensor and applying a low-rank regularization to discover their common subspace. To solve this joint optimization problem, we derive an efficient, privacy-preserving distributed algorithm based on the Alternating Direction Method of Multipliers, which decomposes the global problem into parallel local updates on clients and an aggregation step on the server. To the end, several extensive experiments on multiple real-world datasets demonstrate that our proposed FMTC framework significantly outperforms various baseline and state-of-the-art federated clustering algorithms.


翻译:谱聚类因其卓越性能已成为最有效的聚类算法之一。然而,现有模型大多针对集中式场景设计,无法适用于现代去中心化环境。此外,当前联邦学习方法因依赖不可靠的伪标签常导致泛化性能不佳,且未能捕捉异构客户端间的潜在关联。为应对这些局限,本文提出名为联邦多任务聚类(即FMTC)的新型框架,旨在为异构客户端学习个性化聚类模型的同时,以隐私保护方式协同利用其共享的底层结构。具体而言,FMTC框架包含两大核心组件:客户端个性化聚类模块——通过参数化映射模型实现鲁棒的样本外推理,规避对不可靠伪标签的依赖;服务器端张量关联模块——通过将所有客户端模型整合为统一张量并施加低秩正则化以发现其公共子空间,显式捕获跨客户端共享知识。针对该联合优化问题,我们基于交替方向乘子法推导出高效、隐私保护的分布式算法,将全局问题分解为客户端并行本地更新与服务器聚合步骤。最终,在多个真实数据集上的大量实验表明,所提出的FMTC框架显著优于各类基线方法与前沿联邦聚类算法。

0
下载
关闭预览

相关内容

【KDD2023】半监督图不平衡回归
专知会员服务
26+阅读 · 2023年5月24日
【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
22+阅读 · 2021年4月20日
【NeurIPS2019】图变换网络:Graph Transformer Network
专知会员服务
112+阅读 · 2019年11月25日
【NeurIPS2019】图变换网络:Graph Transformer Network
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Time-Aware Synthetic Control
Arxiv
0+阅读 · 1月6日
VIP会员
相关VIP内容
【KDD2023】半监督图不平衡回归
专知会员服务
26+阅读 · 2023年5月24日
【CVPR 2021】变换器跟踪TransT: Transformer Tracking
专知会员服务
22+阅读 · 2021年4月20日
【NeurIPS2019】图变换网络:Graph Transformer Network
专知会员服务
112+阅读 · 2019年11月25日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员