《基于强化学习开发战斗行为》美国海军研究生院 - 专知VIP

会员服务 ·

57

军事防务 · 强化学习 · 美国海军研究生院 · 论文 ·

2022 年 6 月 27 日

《基于强化学习开发战斗行为》美国海军研究生院

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习在最近的学术和商业研究项目中的应用已经产生了能够达到或超过人类性能水平的强大系统。本论文的目的是确定通过强化学习训练的智能体是否能够在小型战斗场景中实现最佳性能。在一组计算实验中，训练是在一个简单的总体层面上进行的，模拟能够实现确定性和随机性的战斗模型，神经网络的性能被验证为质量和武力经济性战术原则。总的来说，神经网络能够学习到理想的行为，其中作战模型和强化学习算法对性能的影响最为显著。此外，在集结是最佳战术的情况下，训练时间和学习率被确定为最重要的训练超参数。然而，当武力的经济性是理想的时候，折扣系数是唯一有重大影响的超参数。综上所述，本论文得出结论，强化学习为发展战斗模拟中的智能行为提供了一种有前途的手段，它可以应用于训练或分析领域。建议未来的研究对更大、更复杂的训练场景进行研究，以充分了解强化学习的能力和局限性。

成为VIP会员查看完整内容

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

美国空军大学《使用基于模型的强化学习进行团队空战》100页学位论文

美国空军大学《使用基于模型的强化学习进行团队空战》100页学位论文

专知会员服务

143+阅读 · 2022年7月15日

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

专知会员服务

315+阅读 · 2022年6月23日

《在兵棋推演和模拟中应用强化学习开发作战实体行为》美国海军陆战队、海军研究生院

《在兵棋推演和模拟中应用强化学习开发作战实体行为》美国海军陆战队、海军研究生院

专知会员服务

104+阅读 · 2022年6月16日

《敏捷、抗脆弱、以人工智能为基础的指挥和控制》万字长文，中文版，新南威尔士大学

《敏捷、抗脆弱、以人工智能为基础的指挥和控制》万字长文，中文版，新南威尔士大学

专知会员服务

80+阅读 · 2022年5月18日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

141+阅读 · 2022年5月17日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

87+阅读 · 2022年5月6日

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

专知会员服务

84+阅读 · 2022年4月17日

【AI+军事】14页ppt为讲解《混合作战兵棋推演》概念，美国海军研究生院

【AI+军事】14页ppt为讲解《混合作战兵棋推演》概念，美国海军研究生院

专知会员服务

144+阅读 · 2022年4月7日

捷克国防大学《作战环境联合情报准备在支持未来军事行动中的作用》最新论文

捷克国防大学《作战环境联合情报准备在支持未来军事行动中的作用》最新论文

专知会员服务

108+阅读 · 2022年4月6日

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

148+阅读 · 2022年4月5日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

36+阅读 · 2022年7月31日

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

专知

4+阅读 · 2022年7月16日

只需1次演示，1小时在线训练，机器人真就做到看一遍就会了

只需1次演示，1小时在线训练，机器人真就做到看一遍就会了

机器之心

1+阅读 · 2022年7月15日

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

专知

60+阅读 · 2022年6月9日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

专知

31+阅读 · 2022年4月19日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

AI前线

8+阅读 · 2021年12月13日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

38+阅读 · 2018年1月30日

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

基于代理模型的实用多目标演化算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

应急情景下民航管制员安全行为能力综合测评研究

国家自然科学基金

0+阅读 · 2013年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

不确定环境下集装箱码头物流运作能力仿真建模与动态评估

国家自然科学基金

1+阅读 · 2011年12月31日

可变工作条件下复杂系统维修决策技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于训练效果的部队作战效能评估及作战计划制订方法研究

国家自然科学基金

96+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

仿驾驶员轨迹决策行为的无人驾驶车辆局部路径规划

国家自然科学基金

2+阅读 · 2008年12月31日

Model-Free Generative Replay for Lifelong Reinforcement Learning: Application to Starcraft-2

Arxiv

0+阅读 · 2022年8月16日

MACE: Multi-Agent Autonomous Collaborative Exploration of Unknown Environments

MACE: Multi-Agent Autonomous Collaborative Exploration of Unknown Environments

Arxiv

0+阅读 · 2022年8月16日

Combining Gradients and Probabilities for Heterogeneous Approximation of Neural Networks

Arxiv

0+阅读 · 2022年8月15日

Energy Savings When Migrating Workloads to the Cloud

Arxiv

0+阅读 · 2022年8月15日

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Arxiv

19+阅读 · 2022年5月13日

Recent Advances in Reinforcement Learning in Finance

Arxiv

11+阅读 · 2021年12月8日

Multi-Agent Simulation for AI Behaviour Discovery in Operations Research

Arxiv

40+阅读 · 2021年8月30日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Learning Heuristics over Large Graphs via Deep Reinforcement Learning

Arxiv

12+阅读 · 2019年3月8日

VIP会员

相关主题

美国海军研究生院

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

1+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

1+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

3+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

3+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

6+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

6+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

3+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

4+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

4+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

4+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

3+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

5+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

7+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

6+阅读 · 6月16日

相关VIP内容

美国空军大学《使用基于模型的强化学习进行团队空战》100页学位论文

美国空军大学《使用基于模型的强化学习进行团队空战》100页学位论文

专知会员服务

143+阅读 · 2022年7月15日

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

推荐！中文版《作战战略机动的多智能体协作强化学习研究综述》美国陆军研究实验室最新33页研究报告

专知会员服务

315+阅读 · 2022年6月23日

《在兵棋推演和模拟中应用强化学习开发作战实体行为》美国海军陆战队、海军研究生院

《在兵棋推演和模拟中应用强化学习开发作战实体行为》美国海军陆战队、海军研究生院

专知会员服务

104+阅读 · 2022年6月16日

《敏捷、抗脆弱、以人工智能为基础的指挥和控制》万字长文，中文版，新南威尔士大学

《敏捷、抗脆弱、以人工智能为基础的指挥和控制》万字长文，中文版，新南威尔士大学

专知会员服务

80+阅读 · 2022年5月18日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

141+阅读 · 2022年5月17日

使用博弈论进行国防资源分配管理

使用博弈论进行国防资源分配管理

专知会员服务

87+阅读 · 2022年5月6日

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

【AI+军事】附论文+PPT 《用于战术分析、训练和优化的深度自我优化人工智能》

专知会员服务

84+阅读 · 2022年4月17日

【AI+军事】14页ppt为讲解《混合作战兵棋推演》概念，美国海军研究生院

【AI+军事】14页ppt为讲解《混合作战兵棋推演》概念，美国海军研究生院

专知会员服务

144+阅读 · 2022年4月7日

捷克国防大学《作战环境联合情报准备在支持未来军事行动中的作用》最新论文

捷克国防大学《作战环境联合情报准备在支持未来军事行动中的作用》最新论文

专知会员服务

108+阅读 · 2022年4月6日

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

148+阅读 · 2022年4月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

相关资讯

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

36+阅读 · 2022年7月31日

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

DeepMind最新114页报告《多智能体强化学习中的新兴易货贸易行为》

专知

4+阅读 · 2022年7月16日

只需1次演示，1小时在线训练，机器人真就做到看一遍就会了

只需1次演示，1小时在线训练，机器人真就做到看一遍就会了

机器之心

1+阅读 · 2022年7月15日

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

【军事博弈论】在大规模战斗行动中为旅级作战部队制定有效的优先情报需求

专知

60+阅读 · 2022年6月9日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

美国海军研究生院《人工智能系统：国防应用的独特挑战》中文版（含16页PDF、23页讲解ppt）

专知

31+阅读 · 2022年4月19日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

DeepMind提出强化学习新方法，可实现人机合作

DeepMind提出强化学习新方法，可实现人机合作

AI前线

8+阅读 · 2021年12月13日

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

学界 | 伯克利、OpenAI等提出基于模型的元策略优化强化学习

机器之心

15+阅读 · 2018年10月21日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

38+阅读 · 2018年1月30日

相关基金

基于Markov博弈的计算机网络对抗行动策略分析与建模研究

国家自然科学基金

17+阅读 · 2013年12月31日

基于代理模型的实用多目标演化算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

应急情景下民航管制员安全行为能力综合测评研究

国家自然科学基金

0+阅读 · 2013年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

不确定环境下集装箱码头物流运作能力仿真建模与动态评估

国家自然科学基金

1+阅读 · 2011年12月31日

可变工作条件下复杂系统维修决策技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于训练效果的部队作战效能评估及作战计划制订方法研究

国家自然科学基金

96+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

仿驾驶员轨迹决策行为的无人驾驶车辆局部路径规划

国家自然科学基金

2+阅读 · 2008年12月31日

相关论文

Model-Free Generative Replay for Lifelong Reinforcement Learning: Application to Starcraft-2

Arxiv

0+阅读 · 2022年8月16日

MACE: Multi-Agent Autonomous Collaborative Exploration of Unknown Environments

MACE: Multi-Agent Autonomous Collaborative Exploration of Unknown Environments

Arxiv

0+阅读 · 2022年8月16日

Combining Gradients and Probabilities for Heterogeneous Approximation of Neural Networks

Arxiv

0+阅读 · 2022年8月15日

Energy Savings When Migrating Workloads to the Cloud

Arxiv

0+阅读 · 2022年8月15日

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Emergent Bartering Behaviour in Multi-Agent Reinforcement Learning

Arxiv

19+阅读 · 2022年5月13日

Recent Advances in Reinforcement Learning in Finance

Arxiv

11+阅读 · 2021年12月8日

Multi-Agent Simulation for AI Behaviour Discovery in Operations Research

Arxiv

40+阅读 · 2021年8月30日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Learning Heuristics over Large Graphs via Deep Reinforcement Learning

Arxiv

12+阅读 · 2019年3月8日

微信扫码咨询专知VIP会员