研究了深度强化学习在开发自主兵棋推演智能体方面的潜力。探讨了兵棋推演环境对于学习系统设计的相关特征、学习框架与算法的选择。尽管深度强化学习已被证明能在多种游戏中达到超人类水平,但这些发现仅能部分迁移到实际兵棋推演中。这归因于现实世界的限制,例如资金与数据资源的可用性,以及兵棋推演领域可能很少能满足的系统架构要求。现代战争模拟环境的高度逼真性往往伴随着系统延迟,从而导致不切实际的训练时长。为了进行实证分析,采用了多种深度强化学习技术,将其适配于广受欢迎的《指挥:现代作战》模拟环境,并为此环境中的深度强化学习训练应用提供了概念验证。

本文结构如下。第二部分回顾了当前关于深度强化学习应用于兵棋推演的文献。第三部分结合深度强化学习的应用,阐述了兵棋推演的主要制约因素。第四部分讨论了在兵棋推演中定义有效深度强化学习算法所需的设计选择。第五部分介绍了模拟软件《指挥:现代作战》以及为实现更低延迟而开发的轻量化替代方案“战争模拟器”。第六部分,将研究发现应用于《指挥:现代作战》和“战争模拟器”中的简单兵棋推演场景。报告了不同强化学习方案在两者中的训练性能。结论与展望在第七部分。在附录中,汇集了关于传统搜索算法、强化学习及深度强化学习的背景概念,并讨论了如何为特定兵棋推演选择最合适的强化学习算法。

成为VIP会员查看完整内容
9

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《深度强化学习在兵棋推演中的应用》最新40页
专知会员服务
26+阅读 · 2月15日
《基于强化学习与循环神经网络的六角格兵棋研究》146页
作战方案驱动的可学习兵棋推演智能体研究
专知会员服务
47+阅读 · 2024年7月28日
深度强化学习及其在军事领域中的应用综述
专知会员服务
188+阅读 · 2023年4月22日
深度学习研究及军事应用综述
专知会员服务
177+阅读 · 2022年7月7日
深度学习研究及军事应用综述
专知
29+阅读 · 2022年7月7日
兵棋推演的智能决策技术与挑战
专知
28+阅读 · 2022年7月5日
资源 | 《深度强化学习》手稿开放了!
THU数据派
16+阅读 · 2018年10月24日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
最新内容
【NTU博士论文】3D人体动作生成
专知会员服务
1+阅读 · 今天14:48
以色列军事技术对美国军力发展的持续性赋能
专知会员服务
7+阅读 · 今天8:46
《深度强化学习在兵棋推演中的应用》40页报告
专知会员服务
9+阅读 · 今天5:37
《多域作战面临复杂现实》
专知会员服务
7+阅读 · 今天5:35
《印度的多域作战:条令与能力发展》报告
专知会员服务
3+阅读 · 今天5:24
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
国家自然科学基金
12+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员