《深度强化学习在集群系统中的应用》31页论文 - 专知VIP

会员服务 ·

32

军事防务 · 深度强化学习 · 多智能体 · 集群系统 ·

2023 年 3 月 14 日

《深度强化学习在集群系统中的应用》31页论文

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

最近，深度强化学习（RL）方法已被成功应用于多智能体场景。通常情况下，分布式决策的观测向量是由一个智能体收集的关于其他智能体（局部）信息的串联来表示。然而，串联法在具有大量同质智能体的集群系统中的扩展性很差，因为它没有利用这些系统固有的基本特性：（i）集群中的智能体是可以互换的；（ii）集群中智能体的确切数量是不相关的。因此，我们提出了一种新的基于分布式均值嵌入的深度多智能体RL状态表示，我们将智能体视为样本，并使用经验的均值嵌入作为分布式策略的输入。我们使用直方图、径向基函数和端到端训练的神经网络来定义均值嵌入的不同特征空间。我们对集群文献中的两个著名问题--交会和追赶逃避--在全局和局部可观察的设置中评估了该表示。对于本地设置，我们进一步引入了简单的通信协议。在所有的方法中，使用神经网络特征的平均嵌入表示能够在相邻的智能体之间进行最丰富的信息交流，促进复杂的集体策略的开发。

成为VIP会员查看完整内容

61

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

美国空军 |《自主智能体高效公平的分布式任务分配算法》2023最新技术报告

美国空军 |《自主智能体高效公平的分布式任务分配算法》2023最新技术报告

专知会员服务

142+阅读 · 2023年3月25日

【阿姆斯特丹博士论文】为强化学习和计算机视觉应用构建深度学习模型，216页pdf

【阿姆斯特丹博士论文】为强化学习和计算机视觉应用构建深度学习模型，216页pdf

专知会员服务

50+阅读 · 2023年3月22日

《分布式多智能体深度强化学习：竞争性博弈》最新论文

《分布式多智能体深度强化学习：竞争性博弈》最新论文

专知会员服务

131+阅读 · 2023年3月16日

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

专知会员服务

44+阅读 · 2023年2月2日

【伯克利博士论文】可信赖机器学习，227页pdf

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

89+阅读 · 2022年12月12日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

《多智能体任务规划》2022博士论文

《多智能体任务规划》2022博士论文

专知会员服务

288+阅读 · 2022年11月20日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知会员服务

273+阅读 · 2022年10月5日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知会员服务

51+阅读 · 2022年9月2日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【DARPA终身学习机器（L2M）计划】《终身学习衡量标准》约翰霍普金斯大学应用物理实验室2022最新23页论文

【DARPA终身学习机器（L2M）计划】《终身学习衡量标准》约翰霍普金斯大学应用物理实验室2022最新23页论文

专知

3+阅读 · 2022年11月8日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

《探索多行动回合制兵棋的学习分类系统行为》美国空军学院2022最新102页论文

《探索多行动回合制兵棋的学习分类系统行为》美国空军学院2022最新102页论文

专知

8+阅读 · 2022年9月28日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知

3+阅读 · 2022年9月3日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

26+阅读 · 2022年7月5日

【论文笔记】基于强化学习的人机对话

【论文笔记】基于强化学习的人机对话

专知

20+阅读 · 2019年9月21日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

OpenAI ICLR 2018论文汇总：主要兴趣为强化学习

OpenAI ICLR 2018论文汇总：主要兴趣为强化学习

论智

19+阅读 · 2018年5月1日

干货｜深度强化学习在面向任务的对话管理中的应用

干货｜深度强化学习在面向任务的对话管理中的应用

全球人工智能

13+阅读 · 2017年9月14日

基于二值特征描述符的目标表示及其应用

国家自然科学基金

2+阅读 · 2014年12月31日

时延异构多自主体系统的一致性研究及其在混合无人机/无人车系统中的应用

国家自然科学基金

5+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于跨域深度学习的复杂视频场景分类方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于集值函数描述的移动机器人自主行为基础问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于矩阵与图理论的多智能体一致性分析研究

国家自然科学基金

2+阅读 · 2011年12月31日

跨姿态人脸识别研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于"非监督-监督-激励"集成学习模式的机器人行为自主学习系统研究

国家自然科学基金

1+阅读 · 2010年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于视觉注意机制的多尺度图像融合的研究

国家自然科学基金

1+阅读 · 2009年12月31日

Short definitions in constraint languages

Arxiv

0+阅读 · 2023年5月3日

Judgment Sieve: Reducing Uncertainty in Group Judgments through Interventions Targeting Ambiguity versus Disagreement

Arxiv

0+阅读 · 2023年5月2日

AQ-GT: a Temporally Aligned and Quantized GRU-Transformer for Co-Speech Gesture Synthesis

Arxiv

0+阅读 · 2023年5月2日

SIHR: Statistical Inference in High-Dimensional Linear and Logistic Regression Models

Arxiv

0+阅读 · 2023年5月2日

Neural Stein critics with staged $L^2$-regularization

Arxiv

0+阅读 · 2023年5月2日

H2CGL: Modeling Dynamics of Citation Network for Impact Prediction

Arxiv

0+阅读 · 2023年4月16日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

111+阅读 · 2023年4月11日

CausalVAE: Disentangled Representation Learning via Neural Structural Causal Models

Arxiv

17+阅读 · 2021年3月23日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

VIP会员

相关主题

深度强化学习

最新内容

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

6+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

5+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

7+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

7+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

9+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

8+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

8+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

9+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

11+阅读 · 6月24日

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

10+阅读 · 6月24日

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

7+阅读 · 6月24日

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

10+阅读 · 6月24日

相关VIP内容

美国空军 |《自主智能体高效公平的分布式任务分配算法》2023最新技术报告

美国空军 |《自主智能体高效公平的分布式任务分配算法》2023最新技术报告

专知会员服务

142+阅读 · 2023年3月25日

【阿姆斯特丹博士论文】为强化学习和计算机视觉应用构建深度学习模型，216页pdf

【阿姆斯特丹博士论文】为强化学习和计算机视觉应用构建深度学习模型，216页pdf

专知会员服务

50+阅读 · 2023年3月22日

《分布式多智能体深度强化学习：竞争性博弈》最新论文

《分布式多智能体深度强化学习：竞争性博弈》最新论文

专知会员服务

131+阅读 · 2023年3月16日

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

《综述：自主无人机竞赛》2023最新20页论文，苏黎世大学

专知会员服务

44+阅读 · 2023年2月2日

【伯克利博士论文】可信赖机器学习，227页pdf

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

89+阅读 · 2022年12月12日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

《多智能体任务规划》2022博士论文

《多智能体任务规划》2022博士论文

专知会员服务

288+阅读 · 2022年11月20日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知会员服务

273+阅读 · 2022年10月5日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知会员服务

51+阅读 · 2022年9月2日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

热门VIP内容

开通专知VIP会员享更多权益服务

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

网状网络及其在军事领域的运用

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

相关资讯

【DARPA终身学习机器（L2M）计划】《终身学习衡量标准》约翰霍普金斯大学应用物理实验室2022最新23页论文

【DARPA终身学习机器（L2M）计划】《终身学习衡量标准》约翰霍普金斯大学应用物理实验室2022最新23页论文

专知

3+阅读 · 2022年11月8日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

《探索多行动回合制兵棋的学习分类系统行为》美国空军学院2022最新102页论文

《探索多行动回合制兵棋的学习分类系统行为》美国空军学院2022最新102页论文

专知

8+阅读 · 2022年9月28日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知

3+阅读 · 2022年9月3日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

26+阅读 · 2022年7月5日

【论文笔记】基于强化学习的人机对话

【论文笔记】基于强化学习的人机对话

专知

20+阅读 · 2019年9月21日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

OpenAI ICLR 2018论文汇总：主要兴趣为强化学习

OpenAI ICLR 2018论文汇总：主要兴趣为强化学习

论智

19+阅读 · 2018年5月1日

干货｜深度强化学习在面向任务的对话管理中的应用

干货｜深度强化学习在面向任务的对话管理中的应用

全球人工智能

13+阅读 · 2017年9月14日

相关基金

基于二值特征描述符的目标表示及其应用

国家自然科学基金

2+阅读 · 2014年12月31日

时延异构多自主体系统的一致性研究及其在混合无人机/无人车系统中的应用

国家自然科学基金

5+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于跨域深度学习的复杂视频场景分类方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于集值函数描述的移动机器人自主行为基础问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于矩阵与图理论的多智能体一致性分析研究

国家自然科学基金

2+阅读 · 2011年12月31日

跨姿态人脸识别研究

国家自然科学基金

1+阅读 · 2011年12月31日

基于"非监督-监督-激励"集成学习模式的机器人行为自主学习系统研究

国家自然科学基金

1+阅读 · 2010年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于视觉注意机制的多尺度图像融合的研究

国家自然科学基金

1+阅读 · 2009年12月31日

相关论文

Short definitions in constraint languages

Arxiv

0+阅读 · 2023年5月3日

Judgment Sieve: Reducing Uncertainty in Group Judgments through Interventions Targeting Ambiguity versus Disagreement

Arxiv

0+阅读 · 2023年5月2日

AQ-GT: a Temporally Aligned and Quantized GRU-Transformer for Co-Speech Gesture Synthesis

Arxiv

0+阅读 · 2023年5月2日

SIHR: Statistical Inference in High-Dimensional Linear and Logistic Regression Models

Arxiv

0+阅读 · 2023年5月2日

Neural Stein critics with staged $L^2$-regularization

Arxiv

0+阅读 · 2023年5月2日

H2CGL: Modeling Dynamics of Citation Network for Impact Prediction

Arxiv

0+阅读 · 2023年4月16日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

111+阅读 · 2023年4月11日

CausalVAE: Disentangled Representation Learning via Neural Structural Causal Models

Arxiv

17+阅读 · 2021年3月23日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Global Relation Embedding for Relation Extraction

Arxiv

10+阅读 · 2018年4月19日

微信扫码咨询专知VIP会员