美国空军大学《使用基于模型的强化学习进行团队空战》100页学位论文 - 专知VIP

会员服务 ·

94

军事防务 · 强化学习 · 团队空战 · 美国空军 · 自主无人作战飞行器 ·

2022 年 7 月 15 日

美国空军大学《使用基于模型的强化学习进行团队空战》100页学位论文

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在可视范围内执行空战，需要飞行员在接近1马赫的飞行速度下，每秒钟做出许多相互关联的决定。战斗机飞行员在训练中花费数年时间学习战术，以便在这些交战中取得成功。然而，他们决策的速度和质量受到人类生物学的限制。自主无人驾驶战斗飞行器（AUCAVs）的出现利用了这一限制，改变了空战的基本原理。然而，最近的研究集中在一对一的交战上，忽略了空战的一个基本规则--永远不要单独飞行。我们制定了第一个广义的空战机动问题（ACMP），称为MvN ACMP，其中M个友军AUCAVs与N个敌军AUCAVs交战，开发一个马尔可夫决策过程（MDP）模型来控制M个蓝军AUCAVs的团队。该MDP模型利用一个5自由度的飞机状态转换模型，并制定了一个定向能量武器能力。状态空间的连续和高维性质阻止了使用经典的动态规划解决方法来确定最佳策略。相反，采用了近似动态规划（ADP）方法，其中实施了一个近似策略迭代算法，以获得相对于高性能基准策略的高质量近似策略。ADP算法利用多层神经网络作为价值函数的近似回归机制。构建了一对一和二对一的场景，以测试AUCAV是否能够超越并摧毁一个优势的敌方AUCAV。在进攻性、防御性和中立性开始时对性能进行评估，从而得出六个问题实例。在六个问题实例中的四个中，ADP策略的表现优于位置-能量基准策略。结果显示，ADP方法模仿了某些基本的战斗机机动和分段战术。

成为VIP会员查看完整内容

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

《反介入区域拒止（A2AD）环境中自主巡航导弹蜂群行为的仿真》美国空军大学2022最新69页报告

《反介入区域拒止（A2AD）环境中自主巡航导弹蜂群行为的仿真》美国空军大学2022最新69页报告

专知会员服务

223+阅读 · 2022年9月11日

《兵棋中无人驾驶飞行器战术编队的优化》巴西航空技术学院等2022最新论文

《兵棋中无人驾驶飞行器战术编队的优化》巴西航空技术学院等2022最新论文

专知会员服务

113+阅读 · 2022年9月6日

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

专知会员服务

28+阅读 · 2022年7月20日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知会员服务

69+阅读 · 2022年7月20日

《带有障碍物和随机目标到达的无人驾驶飞行器路由问题的近似动态规划》美国空军学位论文

《带有障碍物和随机目标到达的无人驾驶飞行器路由问题的近似动态规划》美国空军学位论文

专知会员服务

50+阅读 · 2022年7月20日

《通过运筹学和人工智能方法研究空战机动策略》美国空军技术学院

《通过运筹学和人工智能方法研究空战机动策略》美国空军技术学院

专知会员服务

116+阅读 · 2022年6月23日

《使用模型预测控制和博弈论方法的移动机器人实时控制》140页博士论文

《使用模型预测控制和博弈论方法的移动机器人实时控制》140页博士论文

专知会员服务

56+阅读 · 2022年6月16日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

141+阅读 · 2022年5月17日

美国海军研究生院最新论文《用于杀伤链功能的人工智能方法评估》，220页

美国海军研究生院最新论文《用于杀伤链功能的人工智能方法评估》，220页

专知会员服务

419+阅读 · 2022年4月3日

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

专知会员服务

131+阅读 · 2020年4月19日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

专知

0+阅读 · 2022年7月22日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

27+阅读 · 2022年7月5日

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

13+阅读 · 2022年7月3日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

UC Berkeley博士论文《自动驾驶汽车安全高效的自适应预测和规划》

UC Berkeley博士论文《自动驾驶汽车安全高效的自适应预测和规划》

专知

3+阅读 · 2022年4月6日

无需 ML 专业知识，轻松部署、有效训练游戏试玩智能体

无需 ML 专业知识，轻松部署、有效训练游戏试玩智能体

TensorFlow

0+阅读 · 2021年8月6日

去中心化多智能体导航的基于模型的强化学习 (RL)

去中心化多智能体导航的基于模型的强化学习 (RL)

TensorFlow

13+阅读 · 2021年6月24日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于分布式长标距应变响应的混凝土梁桥使用性能与安全性能指标反演

国家自然科学基金

0+阅读 · 2015年12月31日

函数逼近论的一些极值问题与多元线性问题的可处理性

国家自然科学基金

2+阅读 · 2014年12月31日

机器人运动学形式化分析及其算法验证

国家自然科学基金

3+阅读 · 2014年12月31日

多维脑信号分析方法及其在脑-机接口中的应用研究

国家自然科学基金

4+阅读 · 2013年12月31日

（混合）整数规划问题的快速半拉格朗日蝙蝠算法及其应用研究

国家自然科学基金

1+阅读 · 2013年12月31日

秩亏观测模型条件下的抗差Kalman滤波及其在组合导航中的应用

国家自然科学基金

1+阅读 · 2013年12月31日

空间多主体聚合结构的分布式姿态估计与仿生控制理论研究

国家自然科学基金

1+阅读 · 2013年12月31日

有色噪声下基于噪声约束最小均方估计的语音增强算法

国家自然科学基金

0+阅读 · 2011年12月31日

基于多Agent的通信交互式动态影响图研究及应用

国家自然科学基金

2+阅读 · 2009年12月31日

ANITA: An Optimal Loopless Accelerated Variance-Reduced Gradient Method

Arxiv

0+阅读 · 2022年9月8日

Psychophysical Machine Learning

Psychophysical Machine Learning

Arxiv

0+阅读 · 2022年9月8日

Scheduling Operator Assistance for Shared Autonomy in Multi-Robot Teams

Arxiv

0+阅读 · 2022年9月7日

Obtaining Robust Control and Navigation Policies for Multi-Robot Navigation via Deep Reinforcement Learning

Arxiv

0+阅读 · 2022年9月7日

Link Prediction with Contextualized Self-Supervision

Arxiv

0+阅读 · 2022年9月7日

Decentralized and Communication-Free Multi-Robot Navigation through Distributed Games

Arxiv

41+阅读 · 2021年9月15日

MetaCURE: Meta Reinforcement Learning with Empowerment-Driven Exploration

Arxiv

12+阅读 · 2021年2月7日

Interpreting and Unifying Graph Neural Networks with An Optimization Framework

Arxiv

18+阅读 · 2021年1月28日

已删除

Arxiv

33+阅读 · 2020年3月23日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

自主无人作战飞行器

最新内容

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

7+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

4+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

6+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

4+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

8+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

7+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

4+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

2+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

5+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

3+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

4+阅读 · 7月17日

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

12+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

14+阅读 · 7月16日

相关VIP内容

《反介入区域拒止（A2AD）环境中自主巡航导弹蜂群行为的仿真》美国空军大学2022最新69页报告

《反介入区域拒止（A2AD）环境中自主巡航导弹蜂群行为的仿真》美国空军大学2022最新69页报告

专知会员服务

223+阅读 · 2022年9月11日

《兵棋中无人驾驶飞行器战术编队的优化》巴西航空技术学院等2022最新论文

《兵棋中无人驾驶飞行器战术编队的优化》巴西航空技术学院等2022最新论文

专知会员服务

113+阅读 · 2022年9月6日

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

专知会员服务

28+阅读 · 2022年7月20日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知会员服务

69+阅读 · 2022年7月20日

《带有障碍物和随机目标到达的无人驾驶飞行器路由问题的近似动态规划》美国空军学位论文

《带有障碍物和随机目标到达的无人驾驶飞行器路由问题的近似动态规划》美国空军学位论文

专知会员服务

50+阅读 · 2022年7月20日

《通过运筹学和人工智能方法研究空战机动策略》美国空军技术学院

《通过运筹学和人工智能方法研究空战机动策略》美国空军技术学院

专知会员服务

116+阅读 · 2022年6月23日

《使用模型预测控制和博弈论方法的移动机器人实时控制》140页博士论文

《使用模型预测控制和博弈论方法的移动机器人实时控制》140页博士论文

专知会员服务

56+阅读 · 2022年6月16日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

141+阅读 · 2022年5月17日

美国海军研究生院最新论文《用于杀伤链功能的人工智能方法评估》，220页

美国海军研究生院最新论文《用于杀伤链功能的人工智能方法评估》，220页

专知会员服务

419+阅读 · 2022年4月3日

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

【基于模型的强化学习的博弈论框架】A Game Theoretic Framework for Model Based Reinforcement Learning

专知会员服务

131+阅读 · 2020年4月19日

热门VIP内容

开通专知VIP会员享更多权益服务

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

相关资讯

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

《用神经网络构建预测区间：对自举和保形推理方法的经验评估》美国空军大学195页学位论文

专知

0+阅读 · 2022年7月22日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

美国国防部《图论在建模、仿真、分析OODA环路和信任中的应用：量化任务的成功率》30页报告

专知

27+阅读 · 2022年7月5日

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

13+阅读 · 2022年7月3日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

UC Berkeley博士论文《自动驾驶汽车安全高效的自适应预测和规划》

UC Berkeley博士论文《自动驾驶汽车安全高效的自适应预测和规划》

专知

3+阅读 · 2022年4月6日

无需 ML 专业知识，轻松部署、有效训练游戏试玩智能体

无需 ML 专业知识，轻松部署、有效训练游戏试玩智能体

TensorFlow

0+阅读 · 2021年8月6日

去中心化多智能体导航的基于模型的强化学习 (RL)

去中心化多智能体导航的基于模型的强化学习 (RL)

TensorFlow

13+阅读 · 2021年6月24日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于分布式长标距应变响应的混凝土梁桥使用性能与安全性能指标反演

国家自然科学基金

0+阅读 · 2015年12月31日

函数逼近论的一些极值问题与多元线性问题的可处理性

国家自然科学基金

2+阅读 · 2014年12月31日

机器人运动学形式化分析及其算法验证

国家自然科学基金

3+阅读 · 2014年12月31日

多维脑信号分析方法及其在脑-机接口中的应用研究

国家自然科学基金

4+阅读 · 2013年12月31日

（混合）整数规划问题的快速半拉格朗日蝙蝠算法及其应用研究

国家自然科学基金

1+阅读 · 2013年12月31日

秩亏观测模型条件下的抗差Kalman滤波及其在组合导航中的应用

国家自然科学基金

1+阅读 · 2013年12月31日

空间多主体聚合结构的分布式姿态估计与仿生控制理论研究

国家自然科学基金

1+阅读 · 2013年12月31日

有色噪声下基于噪声约束最小均方估计的语音增强算法

国家自然科学基金

0+阅读 · 2011年12月31日

基于多Agent的通信交互式动态影响图研究及应用

国家自然科学基金

2+阅读 · 2009年12月31日

相关论文

ANITA: An Optimal Loopless Accelerated Variance-Reduced Gradient Method

Arxiv

0+阅读 · 2022年9月8日

Psychophysical Machine Learning

Psychophysical Machine Learning

Arxiv

0+阅读 · 2022年9月8日

Scheduling Operator Assistance for Shared Autonomy in Multi-Robot Teams

Arxiv

0+阅读 · 2022年9月7日

Obtaining Robust Control and Navigation Policies for Multi-Robot Navigation via Deep Reinforcement Learning

Arxiv

0+阅读 · 2022年9月7日

Link Prediction with Contextualized Self-Supervision

Arxiv

0+阅读 · 2022年9月7日

Decentralized and Communication-Free Multi-Robot Navigation through Distributed Games

Arxiv

41+阅读 · 2021年9月15日

MetaCURE: Meta Reinforcement Learning with Empowerment-Driven Exploration

Arxiv

12+阅读 · 2021年2月7日

Interpreting and Unifying Graph Neural Networks with An Optimization Framework

Arxiv

18+阅读 · 2021年1月28日

已删除

Arxiv

33+阅读 · 2020年3月23日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

微信扫码咨询专知VIP会员