应用人工智能模拟空对空作战场景正引起越来越多的关注。迄今为止,高维状态和行动空间、高度复杂的情况信息(如不完全信息和过滤信息、随机性、对任务目标的不完全了解)以及非线性飞行动态对准确的空战决策构成了巨大挑战。当涉及多个异构代理时,这些挑战会更加严峻。我们为具有多个异构代理的空对空作战提出了一个分层多代理强化学习框架。在我们的框架中,决策过程分为两个抽象阶段,异构的低级策略控制单个单位的行动,而高级指挥官策略则根据总体任务目标下达宏观命令。低层次政策是为精确控制部队作战而训练的。它们的训练是按照学习课程安排的,其中包括日益复杂的训练场景和基于联赛的自我比赛。根据预先训练好的低级策略,对指挥官策略进行任务目标训练。经验验证证明了我们设计方案的优势。

成为VIP会员查看完整内容
68

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《未来作战环境中的传感器 C2 实验研究建议》译文版
专知会员服务
48+阅读 · 2023年9月18日
《基于超视距空战模拟的有效导弹发射监督机器学习》
专知会员服务
47+阅读 · 2023年7月10日
《分层学习引导的自动模型发现》美空军17页技术报告
专知会员服务
28+阅读 · 2023年6月28日
《可信人工智能: 将人工智能融入美国陆军知识体系》
专知会员服务
152+阅读 · 2023年4月12日
《军事背景下能力规划的概念模型》
专知会员服务
155+阅读 · 2023年3月28日
《人工智能在作战规划中的应用》北约科技组织18页论文
专知会员服务
152+阅读 · 2022年11月15日
可信任机器学习,34页ppt
专知
5+阅读 · 2022年11月29日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
45+阅读 · 2014年12月31日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
83+阅读 · 2023年3月26日
Arxiv
182+阅读 · 2023年3月24日
VIP会员
最新内容
AutoScientists:自组织智能体团队驱动长期科学实验
战略前沿人工智能的再思考(中文)
专知会员服务
2+阅读 · 今天14:53
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
2+阅读 · 今天14:51
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
2+阅读 · 今天14:38
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
13+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
45+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员