技术进步与人工智能在军事领域的加速渗透,凸显出探索新型空优战术的迫切需求。可消耗自主无人作战飞行器(AUCAV)的部署为维持空战优势提供了潜在路径。传统空战机动训练依赖人类飞行员积累的实战经验,而定向能武器(DEW)等新型装备则催生了尚未充分开发的战术可能性。本研究借助仿真、集成与建模高级框架,探索强化学习(RL)技术在植入空战视觉范围内(WVR)机动决策问题的AUCAV智能体行为优化中的应用。研究将2v2 WVR空战机动问题建模为马尔可夫决策过程(MDP),其中友方AUCAV配备定向能武器并在六自由度(6DOF)环境中运作。核心方法论采用双深度Q网络强化学习算法,对两架友方AUCAV进行集中式训练。通过分阶段学习策略:初期采用密集奖励环境加速基础训练,后期切换至稀疏奖励环境激发自适应与涌现行为,构建系统性训练框架。研究设计典型实验场景评估不同DEW配置下AUCAV作战效能,为后续研究提供基准。通过对学习所得机动战术的定性分析,以及DEW武器参数四因子全析因实验的定量评估,验证强化学习解决方案的有效性,并揭示其对未来武器概念开发的启示价值。

本文结构如下:第二章综述空战机动问题、强化学习解决方案及仿真环境相关研究;第三章阐述2v2空战机动问题建模方法,提出MDP形式化框架,并详述机动战术学习智能体的强化学习实现路径;第四章展示学习机动战术的定性分析结果,以及DEW武器参数四因子全析因实验的定量研究成果;第五章总结研究成果,并提出未来研究方向的战略考量与技术路线。

成为VIP会员查看完整内容
65

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《基于意图的多机器人自主系统持续军事侦察协调》140页
《太空对太空的军事系统——作战范式的转变》最新报告
《空战战术多智能体强化学习中的可解释性》最新报告
专知会员服务
86+阅读 · 2024年10月25日
《定向能武器空战机动问题的近似动态规划方法》94页
专知会员服务
41+阅读 · 2024年6月6日
人工智能和军备控制,80页pdf
专知
16+阅读 · 2022年11月2日
国家自然科学基金
338+阅读 · 2017年12月31日
国家自然科学基金
52+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
51+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
50+阅读 · 2013年12月31日
国家自然科学基金
55+阅读 · 2011年12月31日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
182+阅读 · 2023年3月24日
Arxiv
27+阅读 · 2023年3月17日
VIP会员
最新内容
网状网络及其在军事领域的运用
专知会员服务
1+阅读 · 今天6:18
无美国参与的欧洲战争方式(万字长文)
专知会员服务
2+阅读 · 今天5:54
《国防领域敏感性分析白皮书》
专知会员服务
2+阅读 · 今天3:42
综述 | 从问答到任务完成:Agent系统与Harness设计
Agentic RL:框架、实践与长程智能体训练
专知会员服务
3+阅读 · 6月24日
重新思考无人机时代的生存能力
专知会员服务
7+阅读 · 6月24日
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
5+阅读 · 6月24日
在人工智能加速决策环境中拓展OODA循环
专知会员服务
7+阅读 · 6月24日
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
5+阅读 · 6月24日
相关基金
国家自然科学基金
338+阅读 · 2017年12月31日
国家自然科学基金
52+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
51+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
50+阅读 · 2013年12月31日
国家自然科学基金
55+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员