《推进多智能体系统：面向可扩展与鲁棒的学习与控制》200页 - 专知VIP

会员服务 ·

2

军事防务 · 多智能体 · 博士论文 ·

《推进多智能体系统：面向可扩展与鲁棒的学习与控制》200页

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

许多现代基础设施——如智慧城市、电网和交通网络——本质上是多智能体系统。在这些场景中设计有效的协调机制充满挑战，原因在于模型不确定性、可扩展性约束以及智能体间的激励不协调。本论文通过为多智能体系统开发具有可证明且可验证性能保证的可扩展、高效的学习控制算法，以应对这些挑战。研究工作分为三个主要部分。

第一部分聚焦于为网络化系统设计可扩展的控制与强化学习算法。在诸如智能电网、智能建筑和交通网络等大规模信息物理系统中，智能体通常嵌入在图形结构中，其协调依赖于本地交互和通信。由于通信约束和对可扩展性的需求，分布式控制与强化学习变得至关重要。本部分深入探讨了针对网络化系统的分布式控制与强化学习算法的基本能力及基于样本的设计。通过利用底层网络拓扑，我们证明了分布式控制器能够实现接近最优的全局性能（第二章）。此外，我们开发了兼具通信高效性与样本高效性的分布式强化学习算法，在提供理论保证的同时，也取得了强有力的实证结果（第三章）。

第二部分研究多智能体系统中的策略行为。在诸如交通、交易和能源市场等应用中，系统通常由可能因激励不协调而采取非合作行为的智能体构成。在此类场景中，目标从实现全局最优转向寻找纳什均衡。在第四章中，我们利用多智能体强化学习，开发了高效的数据驱动纳什均衡求解算法。基于"所有一阶稳定点都对应于马尔可夫势博弈中的纳什均衡"这一洞见，我们推导出基于样本的算法，能够使用梯度方法有效地计算它们。在第五章中，我们更进一步，探索旨在促进社会最优结果的均衡选择方法。我们提出了一个统一框架，系统地将多智能体强化学习的序贯结构与均衡选择相结合，使智能体能够收敛到既稳定又符合社会期望的均衡。

第三部分处理不确定环境下的鲁棒性与风险敏感性。现实世界的系统通常在模型不完美、数据有噪声和存在外部干扰的条件下运行。为确保在此类条件下的可靠性能，我们开发了鲁棒且风险敏感的强化学习算法。这包括软鲁棒马尔可夫决策过程的建模，以及具有理论收敛保证的风险感知策略优化技术。

综上所述，这些贡献共同推进了多智能体系统学习与控制的理论与实践前沿。本工作中开发的算法在一系列受现实启发的应用中得到了验证，包括机器人、智能建筑和能源管理。本论文为在日益复杂和不确定的环境中构建具有韧性、高效和协作能力的自主系统奠定了基础。

成为VIP会员查看完整内容

7

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

《多智能体系统与蜂群协同控制：迈向大规模集群控制》120页

《多智能体系统与蜂群协同控制：迈向大规模集群控制》120页

专知会员服务

23+阅读 · 5月8日

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

40+阅读 · 2月2日

《实现协同自主：从人机协作到多智能体系统》最新190页

《实现协同自主：从人机协作到多智能体系统》最新190页

专知会员服务

75+阅读 · 2025年8月1日

《多智能体强化学习中的机制设计优化研究》103页

《多智能体强化学习中的机制设计优化研究》103页

专知会员服务

32+阅读 · 2025年5月31日

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

专知会员服务

28+阅读 · 2025年5月8日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

46+阅读 · 2025年5月6日

《多智能体强化学习中机制设计的优化》103页

《多智能体强化学习中机制设计的优化》103页

专知会员服务

30+阅读 · 2025年5月3日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

60+阅读 · 2025年4月6日

《多智能体合作强化学习中的通信》139页

《多智能体合作强化学习中的通信》139页

专知会员服务

45+阅读 · 2025年2月17日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

105+阅读 · 2022年9月21日

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知

11+阅读 · 2022年11月26日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

36+阅读 · 2022年1月8日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

123+阅读 · 2020年1月29日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

新书推荐《推荐系统进展：方法与技术》

新书推荐《推荐系统进展：方法与技术》

LibRec智能推荐

13+阅读 · 2019年3月18日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

专知

11+阅读 · 2019年2月8日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

多智能体系统有限时间一致性的自适应控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

Recursive Multi-Agent Systems

Arxiv

0+阅读 · 4月28日

Latency and Cost of Multi-Agent Intelligent Tutoring at Scale

Arxiv

0+阅读 · 4月27日

Do LLM-derived graph priors improve multi-agent coordination?

Arxiv

0+阅读 · 4月19日

Reasoning Provenance for Autonomous AI Agents: Structured Behavioral Analytics Beyond State Checkpoints and Execution Traces

Arxiv

1+阅读 · 4月10日

Modeling Concurrent Multi-Agent Systems

Arxiv

0+阅读 · 4月7日

Self-Optimizing Multi-Agent Systems for Deep Research

Arxiv

0+阅读 · 4月3日

Verifiable Semantics for Agent-to-Agent Communication

Arxiv

0+阅读 · 3月19日

XSkill: Continual Learning from Experience and Skills in Multimodal Agents

Arxiv

0+阅读 · 3月12日

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Arxiv

0+阅读 · 3月9日

From Competition to Coordination: Market Making as a Scalable Framework for Safe and Aligned Multi-Agent LLM Systems

Arxiv

0+阅读 · 2月23日

VIP会员

相关主题

最新内容

【博士论文】面向可扩展且可信智能系统的强化学习

【博士论文】面向可扩展且可信智能系统的强化学习

专知会员服务

0+阅读 · 今天12:32

世界动作模型: 具身AI的下一个前沿

世界动作模型: 具身AI的下一个前沿

专知会员服务

0+阅读 · 今天12:28

全球十大防空反导系统：列表、射程与用途

全球十大防空反导系统：列表、射程与用途

专知会员服务

10+阅读 · 今天3:53

俄乌战争中的乌克兰一体化防空反导实战经验教训（5000字，中文版下载）

俄乌战争中的乌克兰一体化防空反导实战经验教训（5000字，中文版下载）

专知会员服务

20+阅读 · 今天3:03

集中式指挥、分布式控制、脱节训练？——统一作战管理架构是北约分布式作战与训练的关键（中文版PDF下载）

集中式指挥、分布式控制、脱节训练？——统一作战管理架构是北约分布式作战与训练的关键（中文版PDF下载）

专知会员服务

15+阅读 · 今天2:35

《实现协作自主：从人机团队到多智能体系统》190页

《实现协作自主：从人机团队到多智能体系统》190页

专知会员服务

11+阅读 · 今天2:31

《推进多智能体系统：面向可扩展与鲁棒的学习与控制》200页

《推进多智能体系统：面向可扩展与鲁棒的学习与控制》200页

专知会员服务

7+阅读 · 今天2:28

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

专知会员服务

8+阅读 · 今天2:25

[ICML 2026] SOL：让大模型把算力花在关键Token上：自优化语言模型

[ICML 2026] SOL：让大模型把算力花在关键Token上：自优化语言模型

专知会员服务

4+阅读 · 5月12日

人工智能解释公平性：统一框架、公理与负责任AI的未来方向

人工智能解释公平性：统一框架、公理与负责任AI的未来方向

专知会员服务

7+阅读 · 5月12日

《美军软件工厂案例研究：空军数字人才的人员需求》

《美军软件工厂案例研究：空军数字人才的人员需求》

专知会员服务

10+阅读 · 5月12日

《美国防部DevSecOps实践现状：软件工厂之现代战争的数字兵工厂》47页文件

《美国防部DevSecOps实践现状：软件工厂之现代战争的数字兵工厂》47页文件

专知会员服务

11+阅读 · 5月12日

有意义的人类指挥：迈向军事人机交互新模型探析（中文版PDF下载，2.5万字，2026年）

有意义的人类指挥：迈向军事人机交互新模型探析（中文版PDF下载，2.5万字，2026年）

专知会员服务

22+阅读 · 5月12日

《执行无人机蜂群任务：智能体增强大语言模型推理赋能无人机物联网》

《执行无人机蜂群任务：智能体增强大语言模型推理赋能无人机物联网》

专知会员服务

10+阅读 · 5月12日

下一代软件定义无线电：锻造现代战场的数字支柱

下一代软件定义无线电：锻造现代战场的数字支柱

专知会员服务

9+阅读 · 5月12日

相关VIP内容

《多智能体系统与蜂群协同控制：迈向大规模集群控制》120页

《多智能体系统与蜂群协同控制：迈向大规模集群控制》120页

专知会员服务

23+阅读 · 5月8日

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

40+阅读 · 2月2日

《实现协同自主：从人机协作到多智能体系统》最新190页

《实现协同自主：从人机协作到多智能体系统》最新190页

专知会员服务

75+阅读 · 2025年8月1日

《多智能体强化学习中的机制设计优化研究》103页

《多智能体强化学习中的机制设计优化研究》103页

专知会员服务

32+阅读 · 2025年5月31日

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

专知会员服务

28+阅读 · 2025年5月8日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

46+阅读 · 2025年5月6日

《多智能体强化学习中机制设计的优化》103页

《多智能体强化学习中机制设计的优化》103页

专知会员服务

30+阅读 · 2025年5月3日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

60+阅读 · 2025年4月6日

《多智能体合作强化学习中的通信》139页

《多智能体合作强化学习中的通信》139页

专知会员服务

45+阅读 · 2025年2月17日

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

【MIT博士论文】对抗场景中鲁棒且可扩展的多智能体强化学习，123页pdf

专知会员服务

105+阅读 · 2022年9月21日

热门VIP内容

开通专知VIP会员享更多权益服务

世界动作模型: 具身AI的下一个前沿

俄乌战争中的乌克兰一体化防空反导实战经验教训（5000字，中文版下载）

【博士论文】面向可扩展且可信智能系统的强化学习

全球十大防空反导系统：列表、射程与用途

相关资讯

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知

11+阅读 · 2022年11月26日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

36+阅读 · 2022年1月8日

经典书《斯坦福大学-多智能体系统》532页pdf

经典书《斯坦福大学-多智能体系统》532页pdf

专知

123+阅读 · 2020年1月29日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

新书推荐《推荐系统进展：方法与技术》

新书推荐《推荐系统进展：方法与技术》

LibRec智能推荐

13+阅读 · 2019年3月18日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

专知

11+阅读 · 2019年2月8日

相关基金

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

多智能体系统有限时间一致性的自适应控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

相关论文

Recursive Multi-Agent Systems

Arxiv

0+阅读 · 4月28日

Latency and Cost of Multi-Agent Intelligent Tutoring at Scale

Arxiv

0+阅读 · 4月27日

Do LLM-derived graph priors improve multi-agent coordination?

Arxiv

0+阅读 · 4月19日

Reasoning Provenance for Autonomous AI Agents: Structured Behavioral Analytics Beyond State Checkpoints and Execution Traces

Arxiv

1+阅读 · 4月10日

Modeling Concurrent Multi-Agent Systems

Arxiv

0+阅读 · 4月7日

Self-Optimizing Multi-Agent Systems for Deep Research

Arxiv

0+阅读 · 4月3日

Verifiable Semantics for Agent-to-Agent Communication

Arxiv

0+阅读 · 3月19日

XSkill: Continual Learning from Experience and Skills in Multimodal Agents

Arxiv

0+阅读 · 3月12日

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Arxiv

0+阅读 · 3月9日

From Competition to Coordination: Market Making as a Scalable Framework for Safe and Aligned Multi-Agent LLM Systems

Arxiv

0+阅读 · 2月23日

微信扫码咨询专知VIP会员