在可视范围内执行空战,需要飞行员在接近1马赫的飞行速度下,每秒钟做出许多相互关联的决定。战斗机飞行员在训练中花费数年时间学习战术,以便在这些交战中取得成功。然而,他们决策的速度和质量受到人类生物学的限制。自主无人驾驶战斗飞行器(AUCAVs)的出现利用了这一限制,改变了空战的基本原理。然而,最近的研究集中在一对一的交战上,忽略了空战的一个基本规则--永远不要单独飞行。我们制定了第一个广义的空战机动问题(ACMP),称为MvN ACMP,其中M个友军AUCAVs与N个敌军AUCAVs交战,开发一个马尔可夫决策过程(MDP)模型来控制M个蓝军AUCAVs的团队。该MDP模型利用一个5自由度的飞机状态转换模型,并制定了一个定向能量武器能力。状态空间的连续和高维性质阻止了使用经典的动态规划解决方法来确定最佳策略。相反,采用了近似动态规划(ADP)方法,其中实施了一个近似策略迭代算法,以获得相对于高性能基准策略的高质量近似策略。ADP算法利用多层神经网络作为价值函数的近似回归机制。构建了一对一和二对一的场景,以测试AUCAV是否能够超越并摧毁一个优势的敌方AUCAV。在进攻性、防御性和中立性开始时对性能进行评估,从而得出六个问题实例。在六个问题实例中的四个中,ADP策略的表现优于位置-能量基准策略。结果显示,ADP方法模仿了某些基本的战斗机机动和分段战术。

成为VIP会员查看完整内容
142

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
综述:军事应用中使用的一些重要算法
专知
13+阅读 · 2022年7月3日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Psychophysical Machine Learning
Arxiv
0+阅读 · 2022年9月8日
已删除
Arxiv
33+阅读 · 2020年3月23日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
最新内容
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
3+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
14+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
8+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
战略前沿人工智能的再思考(中文)
专知会员服务
8+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
6+阅读 · 5月29日
相关VIP内容
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员