We present a novel theoretical analysis of Federated SARSA (FedSARSA) with linear function approximation and local training. We establish convergence guarantees for FedSARSA in the presence of heterogeneity, both in local transitions and rewards, providing the first sample and communication complexity bounds in this setting. At the core of our analysis is a new, exact multi-step error expansion for single-agent SARSA, which is of independent interest. Our analysis precisely quantifies the impact of heterogeneity, demonstrating the convergence of FedSARSA with multiple local updates. Crucially, we show that FedSARSA achieves linear speed-up with respect to the number of agents, up to higher-order terms due to Markovian sampling. Numerical experiments support our theoretical findings.


翻译:本文提出了一种基于线性函数逼近与本地训练的联邦SARSA(FedSARSA)新理论分析。我们在局部状态转移与奖励函数均存在异构性的条件下,建立了FedSARSA的收敛性保证,首次给出了该设定下的样本复杂度与通信复杂度边界。我们分析的核心是单智能体SARSA的一种新颖且精确的多步误差展开方法,该方法本身具有独立的理论价值。我们的分析精确量化了异构性对算法的影响,证明了FedSARSA在多次本地更新下的收敛性。关键结论表明,在马尔可夫采样引入的高阶误差项范围内,FedSARSA能够实现与智能体数量成比例的线性加速。数值实验验证了我们的理论结果。

0
下载
关闭预览

相关内容

对抗性环境下的后勤:人工智能、优化和理性思考
专知会员服务
36+阅读 · 2024年2月4日
移动边缘网络中联邦学习效率优化综述
专知会员服务
49+阅读 · 2022年7月9日
【WWW2021】大规模智能手机数据的异质联邦学习
专知会员服务
43+阅读 · 2021年3月8日
「联邦学习隐私保护 」最新2022研究综述
专知
16+阅读 · 2022年4月1日
联邦学习研究综述
专知
11+阅读 · 2021年12月25日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
对抗性环境下的后勤:人工智能、优化和理性思考
专知会员服务
36+阅读 · 2024年2月4日
移动边缘网络中联邦学习效率优化综述
专知会员服务
49+阅读 · 2022年7月9日
【WWW2021】大规模智能手机数据的异质联邦学习
专知会员服务
43+阅读 · 2021年3月8日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员