Shard the Gradient, Scale the Model: Serverless Federated Aggregation via Gradient Partitioning - 专知论文

会员服务 ·

0

划分 · 内存 · 梯度 · 服务器 · 缩放 ·

Shard the Gradient, Scale the Model: Serverless Federated Aggregation via Gradient Partitioning

翻译：Shard the Gradient, Scale the Model: Serverless Federated Aggregation via Gradient Partitioning

Federated learning (FL) aggregation on serverless platforms faces a hard scalability ceiling: existing architectures (lambda-FL, LIFL) partition clients across aggregators, but every aggregator must hold the complete model gradient in memory. When gradients exceed the per-function memory limit (e.g., 10 GB on AWS Lambda), aggregation becomes infeasible regardless of tree depth or branching factor. We propose GradsSharding, which instead partitions the gradient tensor into M shards, each averaged independently by a serverless function that receives contributions from all clients. Because FedAvg averaging is element-wise, this produces bit-identical results to tree-based approaches, so model accuracy is invariant by construction. Per-function memory is bounded at O(|θ|/M), independent of client count, enabling aggregation of arbitrarily large models. We evaluate GradsSharding against lambda-FL and LIFL through HPC experiments and real AWS Lambda deployments across model sizes from 43 MB to 5 GB. Results show a cost crossover at approximately 500 MB gradient size, 2.7x cost reduction at VGG-16 scale, and that GradsSharding is the only architecture that remains deployable beyond the serverless memory ceiling.

翻译：联邦学习（FL）在无服务器平台上的聚合面临严峻的可扩展性瓶颈：现有架构（lambda-FL、LIFL）通过将客户端划分至不同聚合器，但每个聚合器必须在内存中保存完整的模型梯度。当梯度超过单函数内存限制（如AWS Lambda的10 GB）时，无论树深度或分支因子如何调整，聚合均不可行。我们提出GradsSharding方法，将梯度张量划分为M个分片，每个分片由一个接收所有客户端贡献的无服务器函数独立求平均。由于FedAvg聚合为逐元素操作，该方法与基于树的聚合方式在比特级上结果一致，因此模型精度在构造上保持不变。单函数内存上限为O(|θ|/M)，与客户端数量无关，从而实现对任意大规模模型的聚合。我们通过HPC实验与真实AWS Lambda部署，在模型大小从43 MB到5 GB的范围内，将GradsSharding与lambda-FL、LIFL进行对比评估。结果表明，在梯度大小约为500 MB时出现成本转折点；在VGG-16规模下成本降低2.7倍；且GradsSharding是唯一在无服务器内存极限以上仍可部署的架构。

0

相关内容

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

专知会员服务

20+阅读 · 2025年9月18日

【剑桥大学博士论文】联邦自监督学习，141页pdf

【剑桥大学博士论文】联邦自监督学习，141页pdf

专知会员服务

19+阅读 · 2024年6月15日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知会员服务

43+阅读 · 2022年12月1日

69页Slides与视频！《网络联邦学习》教程，阿尔托大学Alexander Jung博士讲述大数据网络中如何用联邦学习

69页Slides与视频！《网络联邦学习》教程，阿尔托大学Alexander Jung博士讲述大数据网络中如何用联邦学习

专知会员服务

37+阅读 · 2022年6月5日

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

专知会员服务

28+阅读 · 2022年3月28日

亚马逊最新《联邦学习》简明综述

亚马逊最新《联邦学习》简明综述

专知会员服务

85+阅读 · 2022年2月6日

【ICML2021】面向异构联邦学习的无数据知识蒸馏

专知会员服务

36+阅读 · 2021年7月9日

最新《联邦学习Federated Learning》报告，Federated Learning

最新《联邦学习Federated Learning》报告，Federated Learning

专知会员服务

92+阅读 · 2020年12月2日

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

专知会员服务

21+阅读 · 2020年7月24日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

11+阅读 · 2022年12月1日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

专知

28+阅读 · 2022年7月14日

最新《联邦学习Federated Learning》报告，47页ppt

最新《联邦学习Federated Learning》报告，47页ppt

专知

48+阅读 · 2020年12月2日

无监督分词和句法分析！原来BERT还可以这样用

无监督分词和句法分析！原来BERT还可以这样用

PaperWeekly

12+阅读 · 2020年6月17日

开源 | 基于会话的最优推荐模型：SR-GNN的PaddlePaddle实现

开源 | 基于会话的最优推荐模型：SR-GNN的PaddlePaddle实现

量子位

13+阅读 · 2019年5月13日

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

七月在线实验室

11+阅读 · 2019年3月12日

联邦机器学习-概念与应用，【附19页论文下载】

联邦机器学习-概念与应用，【附19页论文下载】

专知

80+阅读 · 2019年3月9日

React Native 分包哪家强？看这文就够了！

React Native 分包哪家强？看这文就够了！

程序人生

13+阅读 · 2019年1月16日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

低模式耦合串扰光纤和模分复用无源光网络系统基础研究

国家自然科学基金

0+阅读 · 2016年12月31日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

3D堆叠众核处理器共享存储访问均衡性研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

无网格DEM构建方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

稳定广义有限元法的研究与若干典型工程应用

国家自然科学基金

0+阅读 · 2014年12月31日

分形几何中的嵌入问题

国家自然科学基金

0+阅读 · 2014年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

COSMOS: Model-Agnostic Personalized Federated Learning with Clustered Server Models and Pseudo-Label-Only Communication

Arxiv

0+阅读 · 6月10日

FedShield-LLM: A Secure and Scalable Federated Fine-Tuned Large Language Model

Arxiv

0+阅读 · 5月19日

Incentive-Aware Federated Averaging with Performance Guarantees under Strategic Participation

Arxiv

0+阅读 · 5月17日

Pruning Federated Models through Loss Landscape Analysis and Client Agreement Scoring

Arxiv

0+阅读 · 5月12日

DP-LAC: Lightweight Adaptive Clipping for Differentially Private Federated Fine-tuning of Language Models

Arxiv

0+阅读 · 5月11日

Aggressive or Imperceptible, or Both: Network Pruning Assisted Hybrid Byzantines in Federated Learning

Arxiv

0+阅读 · 5月6日

Safe-FedLLM: Delving into the Safety of Federated Large Language Models

Arxiv

0+阅读 · 4月18日

A Full Compression Pipeline for Green Federated Learning in Communication-Constrained Environments

Arxiv

0+阅读 · 4月14日

When the Server Steps In: Calibrated Updates for Fair Federated Learning

Arxiv

0+阅读 · 4月1日

Aergia: Leveraging Heterogeneity in Federated Learning Systems

Arxiv

0+阅读 · 3月18日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

1+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

13+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

专知会员服务

20+阅读 · 2025年9月18日

【剑桥大学博士论文】联邦自监督学习，141页pdf

【剑桥大学博士论文】联邦自监督学习，141页pdf

专知会员服务

19+阅读 · 2024年6月15日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知会员服务

43+阅读 · 2022年12月1日

69页Slides与视频！《网络联邦学习》教程，阿尔托大学Alexander Jung博士讲述大数据网络中如何用联邦学习

69页Slides与视频！《网络联邦学习》教程，阿尔托大学Alexander Jung博士讲述大数据网络中如何用联邦学习

专知会员服务

37+阅读 · 2022年6月5日

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

专知会员服务

28+阅读 · 2022年3月28日

亚马逊最新《联邦学习》简明综述

亚马逊最新《联邦学习》简明综述

专知会员服务

85+阅读 · 2022年2月6日

【ICML2021】面向异构联邦学习的无数据知识蒸馏

专知会员服务

36+阅读 · 2021年7月9日

最新《联邦学习Federated Learning》报告，Federated Learning

最新《联邦学习Federated Learning》报告，Federated Learning

专知会员服务

92+阅读 · 2020年12月2日

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

专知会员服务

21+阅读 · 2020年7月24日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

11+阅读 · 2022年12月1日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

专知

28+阅读 · 2022年7月14日

最新《联邦学习Federated Learning》报告，47页ppt

最新《联邦学习Federated Learning》报告，47页ppt

专知

48+阅读 · 2020年12月2日

无监督分词和句法分析！原来BERT还可以这样用

无监督分词和句法分析！原来BERT还可以这样用

PaperWeekly

12+阅读 · 2020年6月17日

开源 | 基于会话的最优推荐模型：SR-GNN的PaddlePaddle实现

开源 | 基于会话的最优推荐模型：SR-GNN的PaddlePaddle实现

量子位

13+阅读 · 2019年5月13日

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

七月在线实验室

11+阅读 · 2019年3月12日

联邦机器学习-概念与应用，【附19页论文下载】

联邦机器学习-概念与应用，【附19页论文下载】

专知

80+阅读 · 2019年3月9日

React Native 分包哪家强？看这文就够了！

React Native 分包哪家强？看这文就够了！

程序人生

13+阅读 · 2019年1月16日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

相关论文

COSMOS: Model-Agnostic Personalized Federated Learning with Clustered Server Models and Pseudo-Label-Only Communication

Arxiv

0+阅读 · 6月10日

FedShield-LLM: A Secure and Scalable Federated Fine-Tuned Large Language Model

Arxiv

0+阅读 · 5月19日

Incentive-Aware Federated Averaging with Performance Guarantees under Strategic Participation

Arxiv

0+阅读 · 5月17日

Pruning Federated Models through Loss Landscape Analysis and Client Agreement Scoring

Arxiv

0+阅读 · 5月12日

DP-LAC: Lightweight Adaptive Clipping for Differentially Private Federated Fine-tuning of Language Models

Arxiv

0+阅读 · 5月11日

Aggressive or Imperceptible, or Both: Network Pruning Assisted Hybrid Byzantines in Federated Learning

Arxiv

0+阅读 · 5月6日

Safe-FedLLM: Delving into the Safety of Federated Large Language Models

Arxiv

0+阅读 · 4月18日

A Full Compression Pipeline for Green Federated Learning in Communication-Constrained Environments

Arxiv

0+阅读 · 4月14日

When the Server Steps In: Calibrated Updates for Fair Federated Learning

Arxiv

0+阅读 · 4月1日

Aergia: Leveraging Heterogeneity in Federated Learning Systems

Arxiv

0+阅读 · 3月18日

相关基金

低模式耦合串扰光纤和模分复用无源光网络系统基础研究

国家自然科学基金

0+阅读 · 2016年12月31日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

3D堆叠众核处理器共享存储访问均衡性研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

无网格DEM构建方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

稳定广义有限元法的研究与若干典型工程应用

国家自然科学基金

0+阅读 · 2014年12月31日

分形几何中的嵌入问题

国家自然科学基金

0+阅读 · 2014年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员