未来的军事系统日益作为由异构人类智能体与人工智能体组成的分布式社会-技术集合体运作。虽然多智能体强化学习为自适应协调提供了强大的范式,但无约束学习在结构上与指挥权限、法律责任以及在对抗条件下的认知稳定性不相容。本文基于协调约束多智能体强化学习,构建了一个严格的分布式军事人工智能理论框架。我们形式化了在部分可观测、显式通信和信增益条件下的多智能体学习,将"协调"作为一个首要控制变量引入,用以捕捉语义对齐、信任和组织完整性。通信被建模为一种认知性行动,它同时产生信增益和协调损耗。我们利用李雅普诺夫方法推导了稳定性条件,并证明有限自主性和通信速率限制对于协调的集体行为是必要的。所得理论调和了自适应智能与指挥意图、治理和合法控制,为分布式军事人工智能系统的设计提供了原则性基础。

图1:分布式军事人工智能的治理架构。 分布式智能被建模为一个分层动力系统,其中强化学习仅在协调安全自主边界 C⋆ 内运行。治理与权限定义了容许的状态和行动,但并非优化目标。协调被视为一个由障碍函数和不变性条件约束的安全关键状态变量。每当提议的更新会违反协调或信任边界时,学习与协调过程都会被映射回 C⋆ 内。通信是一种认知性行动,它同时增加信增益并引入熵,从而将学习动力学与协调保持相耦合。因此,自主性是状态依赖的,而非二元的。

成为VIP会员查看完整内容
19

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《基于分层多智能体强化学习的逼真空战协同策略》
专知会员服务
46+阅读 · 2025年10月30日
多智能体博弈中的分布式学习: 原理与算法
专知会员服务
54+阅读 · 2024年6月13日
《用于空战机动的分层多智能体强化学习》
专知会员服务
68+阅读 · 2023年10月5日
《可信深度强化学习用于多效协同防御作战:综述》
专知会员服务
73+阅读 · 2023年6月19日
「基于通信的多智能体强化学习」 进展综述
人工智能和军备控制,80页pdf
专知
16+阅读 · 2022年11月2日
人工智能技术在军事领域的应用思考
专知
46+阅读 · 2022年6月11日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
16+阅读 · 2020年9月9日
国家自然科学基金
338+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
马赛克战:俄乌战场透析
专知会员服务
11+阅读 · 今天4:12
《利用人工智能增强军事决策》
专知会员服务
2+阅读 · 今天4:09
《自动机器学习在军事数据耕耘法中的应用》
专知会员服务
4+阅读 · 今天4:02
为何指挥所生存能力要求范式转变
专知会员服务
2+阅读 · 今天3:54
打造“新蛛网”模式与高科技动员
专知会员服务
2+阅读 · 今天3:33
“蛛网”行动一周年:远程无人机战争
专知会员服务
2+阅读 · 今天3:23
【剑桥博士论文】智能体-环境协同优化
专知会员服务
6+阅读 · 6月9日
为初级军官战术训练设计生成式人工智能平台
专知会员服务
8+阅读 · 6月9日
《美军条令:作战伤员后送保障》
专知会员服务
6+阅读 · 6月9日
相关基金
国家自然科学基金
338+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员