EMS-FL: Federated Tuning of Mixture-of-Experts in Satellite-Terrestrial Networks via Expert-Driven Model Splitting - 专知论文

会员服务 ·

0

模型分割 · 分割 · 混合 · 混合模型 · 覆盖 ·

EMS-FL: Federated Tuning of Mixture-of-Experts in Satellite-Terrestrial Networks via Expert-Driven Model Splitting

翻译：EMS-FL：基于专家驱动模型分割的星地网络中专家混合模型联邦调优

Angzi Xu,Zezhong Zhang,Zhi Liu,Shuguang Cui

from arxiv, Submitted to IEEE TMC

The rapid advancement of large AI models imposes stringent demands on data volume and computational resources. Federated learning, though designed to exploit distributed data and computational resources, faces data shortage from limited network coverage and computational constraints from edge devices. To address these issues, both the mixture-of-experts (MoE) and satellite-terrestrial network (STN) provide promising solutions, offering lightweight computation overhead and broad coverage, respectively. However, the satellite-ground relative motion results in intermittent connectivity, hindering conventional federated learning that relies on model synchronization across devices. To leverage the coverage of STN while preserving training efficiency, we propose EMS-FL, an expert-driven model splitting and federated learning method. EMS-FL assigns each device cluster only the experts highly correlated to their local data. Through non-overlapping expert assignments, asynchronous local learning is further proposed, where each device cluster trains its assigned experts consecutively and only uploads local parameters to the satellite during connected phases for aggregation and model updates. Consequently, EMS-FL effectively reduces the training overhead and achieves both faster convergence and higher accuracy compared with conventional federated learning. Rigorous convergence analysis is provided to theoretically characterize the learning performance. Furthermore, comprehensive experiments are conducted using public datasets and large models, validating the superiority of EMS-FL.

翻译：大型人工智能模型的快速发展对数据量和计算资源提出了严格要求。联邦学习虽旨在利用分布式数据与计算资源，却面临网络覆盖有限导致的数据短缺以及边缘设备带来的计算约束。为解决这些问题，专家混合模型与星地网络分别提供了轻量化计算开销与广域覆盖的可行方案。然而，星地相对运动导致间歇性连接，阻碍了依赖设备间模型同步的传统联邦学习。为在保持训练效率的同时利用星地网络的覆盖优势，本文提出EMS-FL——一种专家驱动的模型分割与联邦学习方法。EMS-FL为每个设备集群仅分配与其本地数据高度相关的专家。通过非重叠的专家分配机制，进一步引入异步本地学习策略：各设备集群连续训练其分配的专家，仅在连接阶段将本地参数上传至卫星进行聚合与模型更新。因此，相较于传统联邦学习，EMS-FL显著降低了训练开销，同时实现了更快的收敛速度与更高的准确率。本文通过严格的收敛性分析从理论上刻画了学习性能。此外，基于公开数据集与大型模型的综合实验验证了EMS-FL的优越性。

0

相关内容

模型分割

【CMU博士论文】通信高效且差分隐私的优化方法

【CMU博士论文】通信高效且差分隐私的优化方法

专知会员服务

16+阅读 · 2025年8月2日

模型联邦网络构建及示范应用

模型联邦网络构建及示范应用

专知会员服务

11+阅读 · 2025年7月31日

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

专知会员服务

12+阅读 · 2025年6月15日

《混合专家系统（Mixture-of-Experts）的综合研究：算法、理论与应用

《混合专家系统（Mixture-of-Experts）的综合研究：算法、理论与应用

专知会员服务

47+阅读 · 2025年3月12日

【CMU博士论文】异构网络可信可扩展学习，296页pdf

【CMU博士论文】异构网络可信可扩展学习，296页pdf

专知会员服务

33+阅读 · 2023年9月24日

「分布式机器学习系统网络性能优化」研究进展

「分布式机器学习系统网络性能优化」研究进展

专知会员服务

28+阅读 · 2022年10月1日

移动边缘网络中联邦学习效率优化综述

移动边缘网络中联邦学习效率优化综述

专知会员服务

50+阅读 · 2022年7月9日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

专知会员服务

89+阅读 · 2020年2月28日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

11+阅读 · 2022年12月1日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

专知

20+阅读 · 2020年2月28日

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

专知

31+阅读 · 2020年2月19日

【重磅】联邦学习FL进展与开放问题万字综述论文，58位学者25家机构联合出品，105页pdf438篇文献

【重磅】联邦学习FL进展与开放问题万字综述论文，58位学者25家机构联合出品，105页pdf438篇文献

专知

33+阅读 · 2019年12月15日

联邦学习或将助力IoT走出“数据孤岛”？

联邦学习或将助力IoT走出“数据孤岛”？

中国计算机学会

20+阅读 · 2019年3月16日

【最新综述】模型压缩与加速（附论文全文下载）

【最新综述】模型压缩与加速（附论文全文下载）

专知

28+阅读 · 2019年2月14日

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

泡泡机器人SLAM

11+阅读 · 2018年12月10日

一文读懂复杂网络（应用、模型和研究历史）

一文读懂复杂网络（应用、模型和研究历史）

AI100

16+阅读 · 2017年11月14日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

分层异构网络面向视频流的绿色节能通信研究

国家自然科学基金

6+阅读 · 2015年12月31日

异构云小区网络中基于时延保证的资源配置新方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于调度协议的离散系统网络控制：时滞系统方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

Space Network of Experts: Architecture and Expert Placement

Arxiv

0+阅读 · 5月1日

SplitFT: An Adaptive Federated Split Learning System For LLMs Fine-Tuning

Arxiv

0+阅读 · 4月29日

SL-FAC: A Communication-Efficient Split Learning Framework with Frequency-Aware Compression

Arxiv

0+阅读 · 4月8日

Optimizing Split Federated Learning with Unstable Client Participation

Arxiv

0+阅读 · 4月8日

Pre-Deployment Complexity Estimation for Federated Perception Systems

Arxiv

0+阅读 · 3月30日

Expert Streaming: Accelerating Low-Batch MoE Inference via Multi-chiplet Architecture and Dynamic Expert Trajectory Scheduling

Arxiv

0+阅读 · 3月29日

Federated Hyperdimensional Computing for Resource-Constrained Industrial IoT

Arxiv

0+阅读 · 3月20日

NetSpatial: Spatially Conditional Traffic Generation for Cellular Planning and Operations

Arxiv

0+阅读 · 3月14日

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

Arxiv

0+阅读 · 3月9日

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

Arxiv

0+阅读 · 3月8日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

0+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

1+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

4+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

5+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

9+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

13+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

9+阅读 · 6月17日

相关VIP内容

【CMU博士论文】通信高效且差分隐私的优化方法

【CMU博士论文】通信高效且差分隐私的优化方法

专知会员服务

16+阅读 · 2025年8月2日

模型联邦网络构建及示范应用

模型联邦网络构建及示范应用

专知会员服务

11+阅读 · 2025年7月31日

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

专知会员服务

12+阅读 · 2025年6月15日

《混合专家系统（Mixture-of-Experts）的综合研究：算法、理论与应用

《混合专家系统（Mixture-of-Experts）的综合研究：算法、理论与应用

专知会员服务

47+阅读 · 2025年3月12日

【CMU博士论文】异构网络可信可扩展学习，296页pdf

【CMU博士论文】异构网络可信可扩展学习，296页pdf

专知会员服务

33+阅读 · 2023年9月24日

「分布式机器学习系统网络性能优化」研究进展

「分布式机器学习系统网络性能优化」研究进展

专知会员服务

28+阅读 · 2022年10月1日

移动边缘网络中联邦学习效率优化综述

移动边缘网络中联邦学习效率优化综述

专知会员服务

50+阅读 · 2022年7月9日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

专知会员服务

89+阅读 · 2020年2月28日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

11+阅读 · 2022年12月1日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

专知

20+阅读 · 2020年2月28日

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

专知

31+阅读 · 2020年2月19日

【重磅】联邦学习FL进展与开放问题万字综述论文，58位学者25家机构联合出品，105页pdf438篇文献

【重磅】联邦学习FL进展与开放问题万字综述论文，58位学者25家机构联合出品，105页pdf438篇文献

专知

33+阅读 · 2019年12月15日

联邦学习或将助力IoT走出“数据孤岛”？

联邦学习或将助力IoT走出“数据孤岛”？

中国计算机学会

20+阅读 · 2019年3月16日

【最新综述】模型压缩与加速（附论文全文下载）

【最新综述】模型压缩与加速（附论文全文下载）

专知

28+阅读 · 2019年2月14日

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

泡泡机器人SLAM

11+阅读 · 2018年12月10日

一文读懂复杂网络（应用、模型和研究历史）

一文读懂复杂网络（应用、模型和研究历史）

AI100

16+阅读 · 2017年11月14日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

相关论文

Space Network of Experts: Architecture and Expert Placement

Arxiv

0+阅读 · 5月1日

SplitFT: An Adaptive Federated Split Learning System For LLMs Fine-Tuning

Arxiv

0+阅读 · 4月29日

SL-FAC: A Communication-Efficient Split Learning Framework with Frequency-Aware Compression

Arxiv

0+阅读 · 4月8日

Optimizing Split Federated Learning with Unstable Client Participation

Arxiv

0+阅读 · 4月8日

Pre-Deployment Complexity Estimation for Federated Perception Systems

Arxiv

0+阅读 · 3月30日

Expert Streaming: Accelerating Low-Batch MoE Inference via Multi-chiplet Architecture and Dynamic Expert Trajectory Scheduling

Arxiv

0+阅读 · 3月29日

Federated Hyperdimensional Computing for Resource-Constrained Industrial IoT

Arxiv

0+阅读 · 3月20日

NetSpatial: Spatially Conditional Traffic Generation for Cellular Planning and Operations

Arxiv

0+阅读 · 3月14日

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

Arxiv

0+阅读 · 3月9日

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

Arxiv

0+阅读 · 3月8日

相关基金

分层异构网络面向视频流的绿色节能通信研究

国家自然科学基金

6+阅读 · 2015年12月31日

异构云小区网络中基于时延保证的资源配置新方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于调度协议的离散系统网络控制：时滞系统方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员