Convergence Guarantees for Federated SARSA with Local Training and Heterogeneous Agents - 专知论文

会员服务 ·

0

异构 · 收敛性 · 分析 · 智能体 · 函数逼近 ·

Convergence Guarantees for Federated SARSA with Local Training and Heterogeneous Agents

翻译：联邦SARSA在本地训练与异构智能体下的收敛性保证

Paul Mangold,Eloïse Berthier,Eric Moulines

from arxiv, Deep FedSARSA !

We present a novel theoretical analysis of Federated SARSA (FedSARSA) with linear function approximation and local training. We establish convergence guarantees for FedSARSA in the presence of heterogeneity, both in local transitions and rewards, providing the first sample and communication complexity bounds in this setting. At the core of our analysis is a new, exact multi-step error expansion for single-agent SARSA, which is of independent interest. Our analysis precisely quantifies the impact of heterogeneity, demonstrating the convergence of FedSARSA with multiple local updates. Crucially, we show that FedSARSA achieves linear speed-up with respect to the number of agents, up to higher-order terms due to Markovian sampling. Numerical experiments support our theoretical findings.

翻译：本文提出了一种基于线性函数逼近与本地训练的联邦SARSA（FedSARSA）新理论分析。我们在局部状态转移与奖励函数均存在异构性的条件下，建立了FedSARSA的收敛性保证，首次给出了该设定下的样本复杂度与通信复杂度边界。我们分析的核心是单智能体SARSA的一种新颖且精确的多步误差展开方法，该方法本身具有独立的理论价值。我们的分析精确量化了异构性对算法的影响，证明了FedSARSA在多次本地更新下的收敛性。关键结论表明，在马尔可夫采样引入的高阶误差项范围内，FedSARSA能够实现与智能体数量成比例的线性加速。数值实验验证了我们的理论结果。

0

相关内容

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

专知会员服务

19+阅读 · 2025年9月18日

对抗性环境下的后勤：人工智能、优化和理性思考

对抗性环境下的后勤：人工智能、优化和理性思考

专知会员服务

37+阅读 · 2024年2月4日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知会员服务

43+阅读 · 2022年12月1日

移动边缘网络中联邦学习效率优化综述

移动边缘网络中联邦学习效率优化综述

专知会员服务

50+阅读 · 2022年7月9日

【CVPR 2022】基于本地正则化和稀疏化差分隐私的联邦学习，Differentially Private Federated Learning with Local Regularization and Sparsification

【CVPR 2022】基于本地正则化和稀疏化差分隐私的联邦学习，Differentially Private Federated Learning with Local Regularization and Sparsification

专知会员服务

17+阅读 · 2022年3月19日

【WWW2021】大规模智能手机数据的异质联邦学习

【WWW2021】大规模智能手机数据的异质联邦学习

专知会员服务

43+阅读 · 2021年3月8日

【2020论文翻译】基于SARSA的深度强化学习的移动边缘计算任务分流和资源分配

【2020论文翻译】基于SARSA的深度强化学习的移动边缘计算任务分流和资源分配

专知会员服务

21+阅读 · 2020年5月20日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

51+阅读 · 2020年5月3日

【论文推荐】联邦学习的个性化技术综述，Survey of Personalization Techniques for Federated Learning

【论文推荐】联邦学习的个性化技术综述，Survey of Personalization Techniques for Federated Learning

专知会员服务

79+阅读 · 2020年3月19日

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

专知会员服务

81+阅读 · 2020年3月4日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

11+阅读 · 2022年12月1日

「联邦学习隐私保护」最新2022研究综述

「联邦学习隐私保护」最新2022研究综述

专知

16+阅读 · 2022年4月1日

联邦学习研究综述

联邦学习研究综述

专知

11+阅读 · 2021年12月25日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

专知

20+阅读 · 2020年2月28日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

回顾 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

回顾 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

机器学习研究会

19+阅读 · 2017年12月15日

线上 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

线上 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

机器学习研究会

16+阅读 · 2017年12月12日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

宿主lncRNA4调控流感病毒复制的作用机制

国家自然科学基金

0+阅读 · 2015年12月31日

K连通抗毁性拓扑条件下异构群体的协同一致

国家自然科学基金

1+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于非编码RNA调控网络的复杂疾病致病模式发现研究

国家自然科学基金

1+阅读 · 2015年12月31日

扩展工作条件下基于核免疫集成的SAR目标识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像特征的接收函数各向异性反演研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

诱导性多能干细胞源性MSCs通过线粒体输送对心跳骤停后脑损伤的保护

国家自然科学基金

0+阅读 · 2014年12月31日

Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding

Arxiv

0+阅读 · 3月5日

An Efficient Unsupervised Federated Learning Approach for Anomaly Detection in Heterogeneous IoT Networks

Arxiv

0+阅读 · 2月27日

Conformalized Neural Networks for Federated Uncertainty Quantification under Dual Heterogeneity

Arxiv

0+阅读 · 2月26日

SRFed: Mitigating Poisoning Attacks in Privacy-Preserving Federated Learning with Heterogeneous Data

Arxiv

0+阅读 · 2月18日

ASA: Adaptive Smart Agent Federated Learning via Device-Aware Clustering for Heterogeneous IoT

Arxiv

0+阅读 · 2月16日

FedHENet: A Frugal Federated Learning Framework for Heterogeneous Environments

Arxiv

0+阅读 · 2月13日

FedGRPO: Privately Optimizing Foundation Models with Group-Relative Rewards from Domain Client

Arxiv

0+阅读 · 2月12日

An Adaptive Differentially Private Federated Learning Framework with Bi-level Optimization

Arxiv

0+阅读 · 2月6日

Tri-LLM Cooperative Federated Zero-Shot Intrusion Detection with Semantic Disagreement and Trust-Aware Aggregation

Arxiv

0+阅读 · 1月30日

Incentives in Federated Learning with Heterogeneous Agents

Arxiv

0+阅读 · 1月29日

VIP会员

文章信息

相关主题

最新内容

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

1+阅读 · 今天6:14

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

1+阅读 · 今天5:59

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

3+阅读 · 今天5:54

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

2+阅读 · 今天5:51

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

1+阅读 · 今天5:47

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

9+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

10+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

3+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

12+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

5+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

7+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

17+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

4+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

14+阅读 · 4月18日

相关VIP内容

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

《联邦学习在网络安全中的应用：性能、鲁棒性与对抗性威胁》2025最新145页

专知会员服务

19+阅读 · 2025年9月18日

对抗性环境下的后勤：人工智能、优化和理性思考

对抗性环境下的后勤：人工智能、优化和理性思考

专知会员服务

37+阅读 · 2024年2月4日

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知会员服务

43+阅读 · 2022年12月1日

移动边缘网络中联邦学习效率优化综述

移动边缘网络中联邦学习效率优化综述

专知会员服务

50+阅读 · 2022年7月9日

【CVPR 2022】基于本地正则化和稀疏化差分隐私的联邦学习，Differentially Private Federated Learning with Local Regularization and Sparsification

【CVPR 2022】基于本地正则化和稀疏化差分隐私的联邦学习，Differentially Private Federated Learning with Local Regularization and Sparsification

专知会员服务

17+阅读 · 2022年3月19日

【WWW2021】大规模智能手机数据的异质联邦学习

【WWW2021】大规模智能手机数据的异质联邦学习

专知会员服务

43+阅读 · 2021年3月8日

【2020论文翻译】基于SARSA的深度强化学习的移动边缘计算任务分流和资源分配

【2020论文翻译】基于SARSA的深度强化学习的移动边缘计算任务分流和资源分配

专知会员服务

21+阅读 · 2020年5月20日

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

【微软】大型神经语言模型的对抗性训练，Adversarial Training for Large Neural Language Models

专知会员服务

51+阅读 · 2020年5月3日

【论文推荐】联邦学习的个性化技术综述，Survey of Personalization Techniques for Federated Learning

【论文推荐】联邦学习的个性化技术综述，Survey of Personalization Techniques for Federated Learning

专知会员服务

79+阅读 · 2020年3月19日

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

专知会员服务

81+阅读 · 2020年3月4日

热门VIP内容

开通专知VIP会员享更多权益服务

军事通信系统与设备的技术演进综述

《北约标准：医疗评估手册》174页

乌克兰前线的五项创新

《北约 AI手册：作战人员的实用考量》（2026最新64页）

相关资讯

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

联邦学习如何处理异质性？港科大最新《异质联邦学习》综述，46页pdf全面阐述异质联邦学习的数据空间、统计、系统和模型异质性

专知

11+阅读 · 2022年12月1日

「联邦学习隐私保护」最新2022研究综述

「联邦学习隐私保护」最新2022研究综述

专知

16+阅读 · 2022年4月1日

联邦学习研究综述

联邦学习研究综述

专知

11+阅读 · 2021年12月25日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

【香港科技大学】联邦半监督学习综述，A Survey on Federated Semi-supervised Learning

专知

20+阅读 · 2020年2月28日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

回顾 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

回顾 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

机器学习研究会

19+阅读 · 2017年12月15日

线上 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

线上 | 中科院自动化所副研究员刘康：开放域环境下文本事件抽取

机器学习研究会

16+阅读 · 2017年12月12日

相关论文

Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding

Arxiv

0+阅读 · 3月5日

An Efficient Unsupervised Federated Learning Approach for Anomaly Detection in Heterogeneous IoT Networks

Arxiv

0+阅读 · 2月27日

Conformalized Neural Networks for Federated Uncertainty Quantification under Dual Heterogeneity

Arxiv

0+阅读 · 2月26日

SRFed: Mitigating Poisoning Attacks in Privacy-Preserving Federated Learning with Heterogeneous Data

Arxiv

0+阅读 · 2月18日

ASA: Adaptive Smart Agent Federated Learning via Device-Aware Clustering for Heterogeneous IoT

Arxiv

0+阅读 · 2月16日

FedHENet: A Frugal Federated Learning Framework for Heterogeneous Environments

Arxiv

0+阅读 · 2月13日

FedGRPO: Privately Optimizing Foundation Models with Group-Relative Rewards from Domain Client

Arxiv

0+阅读 · 2月12日

An Adaptive Differentially Private Federated Learning Framework with Bi-level Optimization

Arxiv

0+阅读 · 2月6日

Tri-LLM Cooperative Federated Zero-Shot Intrusion Detection with Semantic Disagreement and Trust-Aware Aggregation

Arxiv

0+阅读 · 1月30日

Incentives in Federated Learning with Heterogeneous Agents

Arxiv

0+阅读 · 1月29日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

宿主lncRNA4调控流感病毒复制的作用机制

国家自然科学基金

0+阅读 · 2015年12月31日

K连通抗毁性拓扑条件下异构群体的协同一致

国家自然科学基金

1+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于非编码RNA调控网络的复杂疾病致病模式发现研究

国家自然科学基金

1+阅读 · 2015年12月31日

扩展工作条件下基于核免疫集成的SAR目标识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像特征的接收函数各向异性反演研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

诱导性多能干细胞源性MSCs通过线粒体输送对心跳骤停后脑损伤的保护

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员