《分布式多智能体强化学习的编码》加州大学等 - 专知VIP

会员服务 ·

23

军事防务 · 多智能体 · 强化学习 · 加州大学 (University of California) ·

2022 年 11 月 2 日

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

DCIST联盟成员的一篇论文开发了一种多智能体强化学习（MARL）算法，该算法使用编码理论来减轻分布式训练中的滞留者效应。滞留者是指延迟的、无反应的或被破坏的计算节点，由于通信瓶颈和对抗性条件，在分布式学习系统中经常发生。编码技术已经被用来加速存在散兵游勇的分布式计算任务，如矩阵乘法和逆问题。他们提出的编码分布式学习框架可以与任何策略梯度方法一起应用，在存在散兵游勇的情况下为MARL问题训练策略。他们开发了多智能体深度确定性策略梯度（MADDPG）的编码分布式版本，这是一种最先进的MARL算法。为了全面了解编码在分布式MARL中的好处，他们研究了各种编码方案，包括最大距离可分离（MDS）编码、随机稀疏编码、基于复制的编码和常规低密度奇偶校验（LDPC）编码。所有这些方法都在几个多机器人问题的模拟中实现，包括协作导航、捕食者-猎物、物理欺骗和远离任务。他们的方法实现了相同的训练精度，同时大大加快了策略梯度算法的训练速度。

图 1：MARL 的未编码分布式学习示意图。

成为VIP会员查看完整内容

57

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

【伯克利博士论文】可信赖机器学习，227页pdf

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

90+阅读 · 2022年12月12日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

106+阅读 · 2022年9月21日

斯坦福博士韩松毕业论文：面向深度学习的高效方法与硬件

斯坦福博士韩松毕业论文：面向深度学习的高效方法与硬件

专知会员服务

57+阅读 · 2022年9月6日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知会员服务

51+阅读 · 2022年9月2日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知会员服务

148+阅读 · 2022年7月8日

【伯克利博士论文】机器人机械搜索的操作与感知策略

【伯克利博士论文】机器人机械搜索的操作与感知策略

专知会员服务

16+阅读 · 2022年6月4日

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

专知会员服务

119+阅读 · 2022年5月7日

【CMU博士论文】通过记忆的元强化学习

【CMU博士论文】通过记忆的元强化学习

专知会员服务

58+阅读 · 2021年10月16日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

专知

8+阅读 · 2022年11月2日

一文读懂字符编码

一文读懂字符编码

阿里技术

0+阅读 · 2022年10月12日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知

3+阅读 · 2022年10月8日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知

8+阅读 · 2022年9月22日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知

5+阅读 · 2022年7月8日

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

专知

84+阅读 · 2022年7月7日

基于压缩感知的通信信号处理理论研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向屏幕视频的编码技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

舰船泵-桨-舵鲁棒智能协调控制技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向空间信息网络的马尔科夫编码传输理论与技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

大规模群体感知和软件协同适应技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

分布式超紧GPS/SINS组合架构下的信号处理方法和完好性评估机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

以腔QED为节点的分布式量子计算及其相关问题的研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向XML数据的关键字查询算法辅助生成技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

不确定多智能体系统一致性的分布式自适应控制

国家自然科学基金

7+阅读 · 2012年12月31日

计算资源受限情况下视频编码新标准HEVC的关键优化问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

SlimFL: Federated Learning with Superposition Coding over Slimmable Neural Networks

Arxiv

0+阅读 · 2022年12月22日

Strategic multi-task coordination over regular networks of robots with limited computation and communication capabilities

Strategic multi-task coordination over regular networks of robots with limited computation and communication capabilities

Arxiv

0+阅读 · 2022年12月21日

Estimating Rate of Change for nonlinear Trajectories in the Framework of Individual Measurement Occasions: A New Perspective on Growth Curves

Arxiv

0+阅读 · 2022年12月20日

Decentralized and Communication-Free Multi-Robot Navigation through Distributed Games

Arxiv

41+阅读 · 2021年9月15日

A continual learning survey: Defying forgetting in classification tasks

Arxiv

32+阅读 · 2021年4月16日

Coding for Distributed Multi-Agent Reinforcement Learning

Arxiv

32+阅读 · 2021年1月7日

Subgraph Neural Networks

Arxiv

27+阅读 · 2020年6月19日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

How Powerful are Graph Neural Networks?

Arxiv

23+阅读 · 2018年10月1日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

加州大学 (University of California)

最新内容

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

0+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

0+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

8+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

4+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

2+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

2+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

6+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

5+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

9+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

10+阅读 · 7月26日

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

专知会员服务

8+阅读 · 7月26日

《反无人机交战场景下的战斗归零研究》

《反无人机交战场景下的战斗归零研究》

专知会员服务

7+阅读 · 7月26日

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

专知会员服务

4+阅读 · 7月26日

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

5+阅读 · 7月25日

相关VIP内容

【伯克利博士论文】可信赖机器学习，227页pdf

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

90+阅读 · 2022年12月12日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知会员服务

113+阅读 · 2022年10月6日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

106+阅读 · 2022年9月21日

斯坦福博士韩松毕业论文：面向深度学习的高效方法与硬件

斯坦福博士韩松毕业论文：面向深度学习的高效方法与硬件

专知会员服务

57+阅读 · 2022年9月6日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知会员服务

51+阅读 · 2022年9月2日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知会员服务

148+阅读 · 2022年7月8日

【伯克利博士论文】机器人机械搜索的操作与感知策略

【伯克利博士论文】机器人机械搜索的操作与感知策略

专知会员服务

16+阅读 · 2022年6月4日

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

专知会员服务

119+阅读 · 2022年5月7日

【CMU博士论文】通过记忆的元强化学习

【CMU博士论文】通过记忆的元强化学习

专知会员服务

58+阅读 · 2021年10月16日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

热门VIP内容

开通专知VIP会员享更多权益服务

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

美空军新型反无人机部队初探

博士论文 | 面向大模型推理的内存高效算法

《无人系统互操作性导论——无人系统联合架构（JAUS）》

相关资讯

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知

2+阅读 · 2022年11月4日

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

专知

8+阅读 · 2022年11月2日

一文读懂字符编码

一文读懂字符编码

阿里技术

0+阅读 · 2022年10月12日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知

3+阅读 · 2022年10月8日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

【安全博弈论 · 博士论文】《博弈论在安全领域的应用》罗格斯新泽西州立大学208页论文

专知

8+阅读 · 2022年9月22日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知

8+阅读 · 2022年9月21日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知

5+阅读 · 2022年7月8日

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

推荐！【中文版】美国陆军《用于决策动力学、欺骗和博弈论的新型人工智能决策辅助工具》52页技术总结报告

专知

84+阅读 · 2022年7月7日

相关基金

基于压缩感知的通信信号处理理论研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向屏幕视频的编码技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

舰船泵-桨-舵鲁棒智能协调控制技术研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向空间信息网络的马尔科夫编码传输理论与技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

大规模群体感知和软件协同适应技术研究

国家自然科学基金

1+阅读 · 2012年12月31日

分布式超紧GPS/SINS组合架构下的信号处理方法和完好性评估机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

以腔QED为节点的分布式量子计算及其相关问题的研究

国家自然科学基金

0+阅读 · 2012年12月31日

面向XML数据的关键字查询算法辅助生成技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

不确定多智能体系统一致性的分布式自适应控制

国家自然科学基金

7+阅读 · 2012年12月31日

计算资源受限情况下视频编码新标准HEVC的关键优化问题研究

国家自然科学基金

0+阅读 · 2011年12月31日

相关论文

SlimFL: Federated Learning with Superposition Coding over Slimmable Neural Networks

Arxiv

0+阅读 · 2022年12月22日

Strategic multi-task coordination over regular networks of robots with limited computation and communication capabilities

Strategic multi-task coordination over regular networks of robots with limited computation and communication capabilities

Arxiv

0+阅读 · 2022年12月21日

Estimating Rate of Change for nonlinear Trajectories in the Framework of Individual Measurement Occasions: A New Perspective on Growth Curves

Arxiv

0+阅读 · 2022年12月20日

Decentralized and Communication-Free Multi-Robot Navigation through Distributed Games

Arxiv

41+阅读 · 2021年9月15日

A continual learning survey: Defying forgetting in classification tasks

Arxiv

32+阅读 · 2021年4月16日

Coding for Distributed Multi-Agent Reinforcement Learning

Arxiv

32+阅读 · 2021年1月7日

Subgraph Neural Networks

Arxiv

27+阅读 · 2020年6月19日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

How Powerful are Graph Neural Networks?

Arxiv

23+阅读 · 2018年10月1日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

微信扫码咨询专知VIP会员