《基于生成式通信模型的分布式智能体学习》127页 - 专知VIP

会员服务 ·

2

军事防务 · 博士论文 · 分布式协作智能 ·

《基于生成式通信模型的分布式智能体学习》127页

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

多智能体系统中的强化学习（RL）是一个重要且快速发展的领域，其应用广泛。单智能体RL方法已在低维和高维状态空间中被证明有效，例如游戏博弈[37, 87]、机器人学[53, 26]以及需要探索的复杂优化问题[52, 56, 73]。多智能体强化学习（MARL）则面临若干额外挑战，包括多智能体信用分配、维度灾难、非平稳学习动态，以及当每个智能体接收私有观测时的部分可观测性[29]。尽管存在这些困难，许多应用本身受益于多个协调的智能体。

分布式MARL提供了一种可扩展且实用的协调方法，其中每个智能体仅基于局部观测和从其他智能体接收的通信来执行其自身的策略。有效的分布式学习通常依赖于一致且可靠的通信。然而，在现实场景中，例如在偏远环境中操作的机器人团队，通信信道往往是稀疏的、不可靠的或带宽受限的。

本文旨在探索使分布式智能体在有限通信条件下有效学习的方法。具体而言，扩展了一类利用集中式训练与分布式执行的分布式MARL算法，以推算缺失的通信，从而使分布式阶段能够持续学习。这是通过为智能体配备联合观测的生成模型或从队友那里学习到的消息编码器来实现的。本文引入了一种新颖的选择性采样方法，该方法通过一种称为“通信优势”的新反事实度量，明确地平衡了消息传递与基于模型的推断。该价值被证明可线性逼近相关的全局优势，实验结果表明，与集中式基线相比，该方法能在不牺牲任务性能的前提下有效减少通信开销。此外，本文对集中化技术进行了全面的研究和实证分析，阐明了它们在流行的离策略MARL算法和环境中的影响。最终，本研究为在资源受限环境中提高MARL的可扩展性和适用性提供了实用的方法和见解。

本文的其余部分组织如下：

第2章包含背景信息和相关工作。
第3章包含广泛的基准测试结果，比较了几种流行算法和环境中所用的集中式训练方法。
第4章包含关于在马尔可夫博弈场景中使用自监督生成建模来推算缺失通信的工作。
第5章包含关于学习针对性通信门控以及通过期望通信优势进行优化的生成模型的工作。
第6章总结了本论文的贡献并得出结论。

成为VIP会员查看完整内容

6

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

《论多智能体决策的复杂性：从博弈学习到部分监控》115页

《论多智能体决策的复杂性：从博弈学习到部分监控》115页

专知会员服务

50+阅读 · 2025年2月26日

《多智能体合作强化学习中的通信》139页

《多智能体合作强化学习中的通信》139页

专知会员服务

45+阅读 · 2025年2月17日

自动驾驶中的多智能体强化学习综述

自动驾驶中的多智能体强化学习综述

专知会员服务

47+阅读 · 2024年8月20日

《多智能体强化学习策略优化算法设计》226页

《多智能体强化学习策略优化算法设计》226页

专知会员服务

64+阅读 · 2024年6月9日

《通过场景独立表征实现多智能体迁移强化学习》2024最新论文

《通过场景独立表征实现多智能体迁移强化学习》2024最新论文

专知会员服务

42+阅读 · 2024年2月28日

《开放环境下协作多智能体强化学习研究进展综述》南大最新62页长综述

《开放环境下协作多智能体强化学习研究进展综述》南大最新62页长综述

专知会员服务

63+阅读 · 2024年2月2日

《多智能体强化学习：基础与现代方法》2023最新320页书稿

《多智能体强化学习：基础与现代方法》2023最新320页书稿

专知会员服务

128+阅读 · 2023年10月26日

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

专知会员服务

75+阅读 · 2023年1月14日

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知会员服务

140+阅读 · 2022年11月26日

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

专知会员服务

119+阅读 · 2022年5月7日

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知

11+阅读 · 2022年11月26日

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

专知

17+阅读 · 2022年11月18日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

32+阅读 · 2022年11月12日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

19+阅读 · 2022年7月11日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

60+阅读 · 2022年4月30日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

16+阅读 · 2020年9月9日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Reinforcement Learning for LLM-based Multi-Agent Systems through Orchestration Traces

Arxiv

0+阅读 · 5月4日

Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own

Arxiv

0+阅读 · 4月23日

MARLIN: Multi-Agent Reinforcement Learning Guided by Language-Based Inter-Robot Negotiation

Arxiv

0+阅读 · 4月13日

A Semi Centralized Training Decentralized Execution Architecture for Multi Agent Deep Reinforcement Learning in Traffic Signal Control

Arxiv

0+阅读 · 3月29日

Partially Observable Multi-Agent Reinforcement Learning with Information Sharing

Arxiv

0+阅读 · 3月12日

Accelerating Robotic Reinforcement Learning with Agent Guidance

Arxiv

0+阅读 · 3月7日

Hierarchical Lead Critic based Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 2月25日

Diffusing to Coordinate: Efficient Online Multi-Agent Diffusion Policies

Arxiv

0+阅读 · 2月20日

A Survey of Progress on Cooperative Multi-agent Reinforcement Learning in Open Environment

Arxiv

39+阅读 · 2023年12月2日

Multi-Agent Reinforcement Learning: Methods, Applications, Visionary Prospects, and Challenges

Arxiv

19+阅读 · 2023年5月17日

VIP会员

相关主题

分布式协作智能

最新内容

美国边境监控技术演变：无人机与人工智能系统（2001-2025年）（中文版下载，1.3万字）

美国边境监控技术演变：无人机与人工智能系统（2001-2025年）（中文版下载，1.3万字）

专知会员服务

5+阅读 · 今天6:24

技术突袭：俄乌战争中新型精确打击武器的战术与效应（中文版下载，2万字）

技术突袭：俄乌战争中新型精确打击武器的战术与效应（中文版下载，2万字）

专知会员服务

5+阅读 · 今天4:57

《基于生成式通信模型的分布式智能体学习》127页

《基于生成式通信模型的分布式智能体学习》127页

专知会员服务

6+阅读 · 今天3:38

《应对无人机威胁：欧洲反无人机系统》最新报告

《应对无人机威胁：欧洲反无人机系统》最新报告

专知会员服务

5+阅读 · 今天3:35

俄罗斯无人机战线实验

俄罗斯无人机战线实验

专知会员服务

5+阅读 · 今天3:29

高阶网络的表示：基于图的框架综述

高阶网络的表示：基于图的框架综述

专知会员服务

8+阅读 · 5月14日

【ICML2026】面向长上下文大语言模型的训练-推理一致性分段执行

【ICML2026】面向长上下文大语言模型的训练-推理一致性分段执行

专知会员服务

4+阅读 · 5月14日

俄乌冲突中的高超音速武器系统及效能评估（中文版PDF下载）

俄乌冲突中的高超音速武器系统及效能评估（中文版PDF下载）

专知会员服务

20+阅读 · 5月14日

《战略冲突的数学建模：基于变分不等式、不动点理论、间隙函数与微分博弈的美以伊冲突分析》

《战略冲突的数学建模：基于变分不等式、不动点理论、间隙函数与微分博弈的美以伊冲突分析》

专知会员服务

12+阅读 · 5月14日

《人工智能中的多智能体自主决策》380页博士论文

《人工智能中的多智能体自主决策》380页博士论文

专知会员服务

16+阅读 · 5月14日

《作战资源再分配的作战行动数学模型构建》

《作战资源再分配的作战行动数学模型构建》

专知会员服务

14+阅读 · 5月14日

乌克兰作为杀伤网实验室：情报监视侦察（ISR）网络赋能自适应无人机战争——经验分析

乌克兰作为杀伤网实验室：情报监视侦察（ISR）网络赋能自适应无人机战争——经验分析

专知会员服务

10+阅读 · 5月14日

【博士论文】面向可扩展且可信智能系统的强化学习

【博士论文】面向可扩展且可信智能系统的强化学习

专知会员服务

8+阅读 · 5月13日

世界动作模型: 具身AI的下一个前沿

世界动作模型: 具身AI的下一个前沿

专知会员服务

15+阅读 · 5月13日

全球十大防空反导系统：列表、射程与用途

全球十大防空反导系统：列表、射程与用途

专知会员服务

16+阅读 · 5月13日

相关VIP内容

《论多智能体决策的复杂性：从博弈学习到部分监控》115页

《论多智能体决策的复杂性：从博弈学习到部分监控》115页

专知会员服务

50+阅读 · 2025年2月26日

《多智能体合作强化学习中的通信》139页

《多智能体合作强化学习中的通信》139页

专知会员服务

45+阅读 · 2025年2月17日

自动驾驶中的多智能体强化学习综述

自动驾驶中的多智能体强化学习综述

专知会员服务

47+阅读 · 2024年8月20日

《多智能体强化学习策略优化算法设计》226页

《多智能体强化学习策略优化算法设计》226页

专知会员服务

64+阅读 · 2024年6月9日

《通过场景独立表征实现多智能体迁移强化学习》2024最新论文

《通过场景独立表征实现多智能体迁移强化学习》2024最新论文

专知会员服务

42+阅读 · 2024年2月28日

《开放环境下协作多智能体强化学习研究进展综述》南大最新62页长综述

《开放环境下协作多智能体强化学习研究进展综述》南大最新62页长综述

专知会员服务

63+阅读 · 2024年2月2日

《多智能体强化学习：基础与现代方法》2023最新320页书稿

《多智能体强化学习：基础与现代方法》2023最新320页书稿

专知会员服务

128+阅读 · 2023年10月26日

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

专知会员服务

75+阅读 · 2023年1月14日

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知会员服务

140+阅读 · 2022年11月26日

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

【“大量”智能体的强化学习】《Many-Agent Reinforcement Learning》，327页博士论文，伦敦大学学院（UCL）

专知会员服务

119+阅读 · 2022年5月7日

热门VIP内容

开通专知VIP会员享更多权益服务

技术突袭：俄乌战争中新型精确打击武器的战术与效应（中文版下载，2万字）

《应对无人机威胁：欧洲反无人机系统》最新报告

美国边境监控技术演变：无人机与人工智能系统（2001-2025年）（中文版下载，1.3万字）

《基于生成式通信模型的分布式智能体学习》127页

相关资讯

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知

11+阅读 · 2022年11月26日

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

【2022新书】深度强化学习基础: Python的理论与实践, 413页pdf

专知

17+阅读 · 2022年11月18日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

32+阅读 · 2022年11月12日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

19+阅读 · 2022年7月11日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

60+阅读 · 2022年4月30日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

16+阅读 · 2020年9月9日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

相关论文

Reinforcement Learning for LLM-based Multi-Agent Systems through Orchestration Traces

Arxiv

0+阅读 · 5月4日

Reinforcement Learning with Foundation Priors: Let the Embodied Agent Efficiently Learn on Its Own

Arxiv

0+阅读 · 4月23日

MARLIN: Multi-Agent Reinforcement Learning Guided by Language-Based Inter-Robot Negotiation

Arxiv

0+阅读 · 4月13日

A Semi Centralized Training Decentralized Execution Architecture for Multi Agent Deep Reinforcement Learning in Traffic Signal Control

Arxiv

0+阅读 · 3月29日

Partially Observable Multi-Agent Reinforcement Learning with Information Sharing

Arxiv

0+阅读 · 3月12日

Accelerating Robotic Reinforcement Learning with Agent Guidance

Arxiv

0+阅读 · 3月7日

Hierarchical Lead Critic based Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 2月25日

Diffusing to Coordinate: Efficient Online Multi-Agent Diffusion Policies

Arxiv

0+阅读 · 2月20日

A Survey of Progress on Cooperative Multi-agent Reinforcement Learning in Open Environment

Arxiv

39+阅读 · 2023年12月2日

Multi-Agent Reinforcement Learning: Methods, Applications, Visionary Prospects, and Challenges

Arxiv

19+阅读 · 2023年5月17日

微信扫码咨询专知VIP会员