人工智能在空战领域正变得越来越重要。目前,大多数空战研究都假定所有飞机信息都是已知的。但在实际应用中,由于现实限制和传感器误差,一些飞机信息,如位置、姿态、速度等,可能是不正确的,或者是不可能获得的。在本文中,我们提出了一种基于深度强化学习的框架,用于开发一种能够在信息不足的部分可观测马尔可夫决策过程(POMDP)条件下执行可视范围(WVR)内空对空作战的模型。为了稳健地应对这种情况,我们使用了递归神经网络,并应用了软评价器(SAC)算法,以有效应对现实限制和传感器误差。此外,为了提高学习效率和效果,我们还应用了课程学习技术来限制状态空间的探索范围。最后,模拟和实验结果表明,所提出的技术能够在嘈杂的环境中处理传感器限制和误差引起的实际问题,同时还能高效地减少学习的训练时间。

图 2 显示了本研究提出的空战模型学习框架概览,该框架由矢量化空战模拟环境和包括重放缓冲器在内的循环 SAC 模块组成。环境中有两个动态模型:己方和目标。它们分别从 SAC 模块的角色和基于规则的行为模型中获得动作 at 和 atarget,并输出飞机状态 sownship 和 starget。模拟器根据这些状态生成奖励 rt 和观测值 ot,同时考虑到配置的传感器特性。轨迹(ot、at、rt)被存储在重放缓冲区中,固定长度的轨迹序列将被采样用于批判。

成为VIP会员查看完整内容
50

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《用于空战机动的分层多智能体强化学习》
专知会员服务
68+阅读 · 2023年10月5日
《基于分类方法的自动人机对话》
专知会员服务
26+阅读 · 2023年7月18日
《基于超视距空战模拟的有效导弹发射监督机器学习》
专知会员服务
47+阅读 · 2023年7月10日
《超视距空战中计算机生成兵力的行为建模》
专知会员服务
110+阅读 · 2023年7月10日
《可信人工智能: 将人工智能融入美国陆军知识体系》
专知会员服务
152+阅读 · 2023年4月12日
《军事背景下能力规划的概念模型》
专知会员服务
155+阅读 · 2023年3月28日
《基于强化学习开发战斗行为》美国海军研究生院
专知会员服务
102+阅读 · 2022年6月27日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
基于深度学习的数据融合方法研究综述
专知
37+阅读 · 2020年12月10日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2010年12月31日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
83+阅读 · 2023年3月26日
Arxiv
182+阅读 · 2023年3月24日
Arxiv
27+阅读 · 2023年3月17日
VIP会员
最新内容
战略前沿人工智能的再思考(中文)
专知会员服务
3+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
3+阅读 · 5月29日
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
2+阅读 · 5月29日
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
13+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关VIP内容
《用于空战机动的分层多智能体强化学习》
专知会员服务
68+阅读 · 2023年10月5日
《基于分类方法的自动人机对话》
专知会员服务
26+阅读 · 2023年7月18日
《基于超视距空战模拟的有效导弹发射监督机器学习》
专知会员服务
47+阅读 · 2023年7月10日
《超视距空战中计算机生成兵力的行为建模》
专知会员服务
110+阅读 · 2023年7月10日
《可信人工智能: 将人工智能融入美国陆军知识体系》
专知会员服务
152+阅读 · 2023年4月12日
《军事背景下能力规划的概念模型》
专知会员服务
155+阅读 · 2023年3月28日
《基于强化学习开发战斗行为》美国海军研究生院
专知会员服务
102+阅读 · 2022年6月27日
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2010年12月31日
微信扫码咨询专知VIP会员