Mosaic: Data-Free Knowledge Distillation via Mixture-of-Experts for Heterogeneous Distributed Environments - 专知论文

会员服务 ·

0

异构 · 知识 · 蒸馏 · 混合 · 无数据知识蒸馏 ·

Mosaic: Data-Free Knowledge Distillation via Mixture-of-Experts for Heterogeneous Distributed Environments

翻译：Mosaic：面向异构分布式环境的基于专家混合的无数据知识蒸馏

Junming Liu,Yanting Gao,Yuqi Li,Siyuan Meng,Yifei Sun,Aoqi Wu,Yirong Chen,Ding Wang,Shiping Wen

from arxiv, 23 pages, 5 figures, 24 tables; Accepted by Knowledge-Based Systems, 2026

Federated Learning (FL) is a decentralized machine learning paradigm that enables clients to collaboratively train models while preserving data privacy. However, the coexistence of model and data heterogeneity gives rise to inconsistent representations and divergent optimization dynamics across clients, ultimately hindering robust global performance. To transcend these challenges, we propose Mosaic, a novel data-free knowledge distillation framework tailored for heterogeneous distributed environments. Mosaic first trains local generative models to approximate each client's personalized distribution, enabling synthetic data generation that safeguards privacy through strict separation from real data. Subsequently, Mosaic forms a Mixture-of-Experts (MoE) from client models based on their specialized knowledge, and distills it into a global model using the generated data. To further enhance the MoE architecture, Mosaic integrates expert predictions via a lightweight meta model trained on a few representative prototypes. Extensive experiments on standard image and multimodal benchmarks demonstrate that Mosaic consistently outperforms state-of-the-art approaches under both model and data heterogeneity. The source code has been published at https://github.com/Wings-Of-Disaster/Mosaic.

翻译：联邦学习（FL）是一种去中心化的机器学习范式，使客户端能够在保护数据隐私的同时协作训练模型。然而，模型异构性与数据异构性的共存导致了客户端间表示不一致和优化动态发散，最终阻碍了全局性能的稳健性。为应对这些挑战，我们提出了Mosaic——一种专为异构分布式环境设计的新型无数据知识蒸馏框架。Mosaic首先训练本地生成模型以近似每个客户端的个性化分布，通过严格分离真实数据生成合成数据以保障隐私。随后，Mosaic基于客户端模型的专长知识构建专家混合模型（MoE），并利用生成数据将其蒸馏至全局模型。为进一步增强MoE架构，Mosaic通过轻量级元模型集成专家预测，该元模型基于少量代表性原型进行训练。在标准图像和多模态基准上的大量实验表明，无论面对模型异构性还是数据异构性，Mosaic均持续优于现有最优方法。源代码已发布于https://github.com/Wings-Of-Disaster/Mosaic。

0

相关内容

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

专知会员服务

20+阅读 · 2025年9月18日

异构联邦学习在无人系统中的研究综述

异构联邦学习在无人系统中的研究综述

专知会员服务

12+阅读 · 2025年5月25日

【CMU博士论文】异构网络可信可扩展学习，296页pdf

【CMU博士论文】异构网络可信可扩展学习，296页pdf

专知会员服务

33+阅读 · 2023年9月24日

【CMU博士论文】异构网络中可扩展且值得信赖的学习方法，147页pdf

【CMU博士论文】异构网络中可扩展且值得信赖的学习方法，147页pdf

专知会员服务

25+阅读 · 2023年8月27日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知会员服务

43+阅读 · 2022年12月1日

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

专知会员服务

28+阅读 · 2022年3月28日

【ICML2021】面向异构联邦学习的无数据知识蒸馏

专知会员服务

36+阅读 · 2021年7月9日

【WWW2021】大规模智能手机数据的异质联邦学习

【WWW2021】大规模智能手机数据的异质联邦学习

专知会员服务

43+阅读 · 2021年3月8日

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

专知会员服务

104+阅读 · 2021年2月3日

最新《联邦学习Federated Learning》报告，Federated Learning

最新《联邦学习Federated Learning》报告，Federated Learning

专知会员服务

92+阅读 · 2020年12月2日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

11+阅读 · 2022年12月1日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

专知

28+阅读 · 2022年7月14日

最新《联邦学习Federated Learning》报告，47页ppt

最新《联邦学习Federated Learning》报告，47页ppt

专知

48+阅读 · 2020年12月2日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

清华大学知识智能研究中心发布大规模MOOC知识资源库MOOCCube及在线学习行为预测挑战赛

清华大学知识智能研究中心发布大规模MOOC知识资源库MOOCCube及在线学习行为预测挑战赛

学术头条

11+阅读 · 2020年6月6日

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

CVer

17+阅读 · 2020年5月18日

再发力！Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版，超越Hinton的SimCLR，刷新SOTA准确率

再发力！Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版，超越Hinton的SimCLR，刷新SOTA准确率

专知

48+阅读 · 2020年3月11日

【重磅】联邦学习FL进展与开放问题万字综述论文，58位学者25家机构联合出品，105页pdf438篇文献

【重磅】联邦学习FL进展与开放问题万字综述论文，58位学者25家机构联合出品，105页pdf438篇文献

专知

33+阅读 · 2019年12月15日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向用户体验的无线异构软件定义网络资源管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

基于网络结构演化的Folksonomy模式中社群知识组织与知识涌现研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

Single-Round Clustered Federated Learning via Data Collaboration Analysis for Non-IID Data

Arxiv

0+阅读 · 6月15日

Conflict-Aware Federated Fine-Tuning of Large Language Models with Mixture-of-Experts

Arxiv

0+阅读 · 6月14日

COSMOS: Model-Agnostic Personalized Federated Learning with Clustered Server Models and Pseudo-Label-Only Communication

Arxiv

0+阅读 · 6月10日

From Data Heterogeneity to Convergence: A Data-Centric Review of Federated Learning

Arxiv

0+阅读 · 6月9日

Totoro$^+$: An Adaptive and Scalable Edge Federated Learning System

Arxiv

0+阅读 · 6月5日

HASA: Subnet Allocation for Compute-Constrained Model-Heterogeneous Federated Learning

Arxiv

0+阅读 · 5月30日

Hardware-Aware Federated Learning for Speech Emotion Recognition

Arxiv

0+阅读 · 5月23日

Privacy-preserving Chunk Scheduling in a BitTorrent Implementation of Federated Learning

Arxiv

0+阅读 · 5月11日

CLAD: A Clustered Label-Agnostic Federated Learning Framework for Joint Anomaly Detection and Attack Classification

Arxiv

0+阅读 · 5月7日

Data-Free Knowledge Distillation for Heterogeneous Federated Learning

Arxiv

12+阅读 · 2021年6月9日

VIP会员

文章信息

相关主题

无数据知识蒸馏

最新内容

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

0+阅读 · 3分钟前

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

0+阅读 · 38分钟前

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

相关VIP内容

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

专知会员服务

20+阅读 · 2025年9月18日

异构联邦学习在无人系统中的研究综述

异构联邦学习在无人系统中的研究综述

专知会员服务

12+阅读 · 2025年5月25日

【CMU博士论文】异构网络可信可扩展学习，296页pdf

【CMU博士论文】异构网络可信可扩展学习，296页pdf

专知会员服务

33+阅读 · 2023年9月24日

【CMU博士论文】异构网络中可扩展且值得信赖的学习方法，147页pdf

【CMU博士论文】异构网络中可扩展且值得信赖的学习方法，147页pdf

专知会员服务

25+阅读 · 2023年8月27日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知会员服务

43+阅读 · 2022年12月1日

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

专知会员服务

28+阅读 · 2022年3月28日

【ICML2021】面向异构联邦学习的无数据知识蒸馏

专知会员服务

36+阅读 · 2021年7月9日

【WWW2021】大规模智能手机数据的异质联邦学习

【WWW2021】大规模智能手机数据的异质联邦学习

专知会员服务

43+阅读 · 2021年3月8日

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

联邦学习中的隐私和鲁棒性:攻击和防御, 杨强等学者最新综述论文，16页pdf

专知会员服务

104+阅读 · 2021年2月3日

最新《联邦学习Federated Learning》报告，Federated Learning

最新《联邦学习Federated Learning》报告，Federated Learning

专知会员服务

92+阅读 · 2020年12月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《履带式无人地面战车技术发展现状》

隐身技术前沿综述：物理机理、工程实践与战略展望

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

相关资讯

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

11+阅读 · 2022年12月1日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

专知

28+阅读 · 2022年7月14日

最新《联邦学习Federated Learning》报告，47页ppt

最新《联邦学习Federated Learning》报告，47页ppt

专知

48+阅读 · 2020年12月2日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

清华大学知识智能研究中心发布大规模MOOC知识资源库MOOCCube及在线学习行为预测挑战赛

清华大学知识智能研究中心发布大规模MOOC知识资源库MOOCCube及在线学习行为预测挑战赛

学术头条

11+阅读 · 2020年6月6日

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

超越MoCo/SimCLR！华人博士提出PCL：无监督学习技术新前沿

CVer

17+阅读 · 2020年5月18日

再发力！Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版，超越Hinton的SimCLR，刷新SOTA准确率

再发力！Facebook AI何恺明等最新研究MoCo(动量对比学习)第二版，超越Hinton的SimCLR，刷新SOTA准确率

专知

48+阅读 · 2020年3月11日

【重磅】联邦学习FL进展与开放问题万字综述论文，58位学者25家机构联合出品，105页pdf438篇文献

【重磅】联邦学习FL进展与开放问题万字综述论文，58位学者25家机构联合出品，105页pdf438篇文献

专知

33+阅读 · 2019年12月15日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

相关论文

Single-Round Clustered Federated Learning via Data Collaboration Analysis for Non-IID Data

Arxiv

0+阅读 · 6月15日

Conflict-Aware Federated Fine-Tuning of Large Language Models with Mixture-of-Experts

Arxiv

0+阅读 · 6月14日

COSMOS: Model-Agnostic Personalized Federated Learning with Clustered Server Models and Pseudo-Label-Only Communication

Arxiv

0+阅读 · 6月10日

From Data Heterogeneity to Convergence: A Data-Centric Review of Federated Learning

Arxiv

0+阅读 · 6月9日

Totoro$^+$: An Adaptive and Scalable Edge Federated Learning System

Arxiv

0+阅读 · 6月5日

HASA: Subnet Allocation for Compute-Constrained Model-Heterogeneous Federated Learning

Arxiv

0+阅读 · 5月30日

Hardware-Aware Federated Learning for Speech Emotion Recognition

Arxiv

0+阅读 · 5月23日

Privacy-preserving Chunk Scheduling in a BitTorrent Implementation of Federated Learning

Arxiv

0+阅读 · 5月11日

CLAD: A Clustered Label-Agnostic Federated Learning Framework for Joint Anomaly Detection and Attack Classification

Arxiv

0+阅读 · 5月7日

Data-Free Knowledge Distillation for Heterogeneous Federated Learning

Arxiv

12+阅读 · 2021年6月9日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向用户体验的无线异构软件定义网络资源管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

基于网络结构演化的Folksonomy模式中社群知识组织与知识涌现研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员