未来的军事系统日益作为由异构人类智能体与人工智能体组成的分布式社会-技术集合体运作。虽然多智能体强化学习为自适应协调提供了强大的范式,但无约束学习在结构上与指挥权限、法律责任以及在对抗条件下的认知稳定性不相容。本文基于协调约束多智能体强化学习,构建了一个严格的分布式军事人工智能理论框架。我们形式化了在部分可观测、显式通信和信增益条件下的多智能体学习,将"协调"作为一个首要控制变量引入,用以捕捉语义对齐、信任和组织完整性。通信被建模为一种认知性行动,它同时产生信增益和协调损耗。我们利用李雅普诺夫方法推导了稳定性条件,并证明有限自主性和通信速率限制对于协调的集体行为是必要的。所得理论调和了自适应智能与指挥意图、治理和合法控制,为分布式军事人工智能系统的设计提供了原则性基础。

图1:分布式军事人工智能的治理架构。 分布式智能被建模为一个分层动力系统,其中强化学习仅在协调安全自主边界 C⋆ 内运行。治理与权限定义了容许的状态和行动,但并非优化目标。协调被视为一个由障碍函数和不变性条件约束的安全关键状态变量。每当提议的更新会违反协调或信任边界时,学习与协调过程都会被映射回 C⋆ 内。通信是一种认知性行动,它同时增加信增益并引入熵,从而将学习动力学与协调保持相耦合。因此,自主性是状态依赖的,而非二元的。

成为VIP会员查看完整内容
8

相关内容

人工智能在军事中可用于多项任务,例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。
《基于分层多智能体强化学习的逼真空战协同策略》
专知会员服务
44+阅读 · 2025年10月30日
多智能体博弈中的分布式学习: 原理与算法
专知会员服务
54+阅读 · 2024年6月13日
《用于空战机动的分层多智能体强化学习》
专知会员服务
68+阅读 · 2023年10月5日
《可信深度强化学习用于多效协同防御作战:综述》
专知会员服务
72+阅读 · 2023年6月19日
「基于通信的多智能体强化学习」 进展综述
人工智能和军备控制,80页pdf
专知
15+阅读 · 2022年11月2日
人工智能技术在军事领域的应用思考
专知
45+阅读 · 2022年6月11日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
15+阅读 · 2020年9月9日
国家自然科学基金
333+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
人工智能在战场行动中的演进及伊朗案例
专知会员服务
4+阅读 · 4月18日
美AI公司Anthropic推出网络安全模型“Mythos”
专知会员服务
2+阅读 · 4月18日
【博士论文】面向城市环境的可解释计算机视觉
大语言模型的自改进机制:技术综述与未来展望
《第四代军事特种作战部队选拔与评估》
专知会员服务
1+阅读 · 4月18日
相关基金
国家自然科学基金
333+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员