强化学习在最近的学术和商业研究项目中的应用已经产生了能够达到或超过人类性能水平的强大系统。本论文的目的是确定通过强化学习训练的智能体是否能够在小型战斗场景中实现最佳性能。在一组计算实验中,训练是在一个简单的总体层面上进行的,模拟能够实现确定性和随机性的战斗模型,神经网络的性能被验证为质量和武力经济性战术原则。总的来说,神经网络能够学习到理想的行为,其中作战模型和强化学习算法对性能的影响最为显著。此外,在集结是最佳战术的情况下,训练时间和学习率被确定为最重要的训练超参数。然而,当武力的经济性是理想的时候,折扣系数是唯一有重大影响的超参数。综上所述,本论文得出结论,强化学习为发展战斗模拟中的智能行为提供了一种有前途的手段,它可以应用于训练或分析领域。建议未来的研究对更大、更复杂的训练场景进行研究,以充分了解强化学习的能力和局限性。

成为VIP会员查看完整内容
104

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
使用博弈论进行国防资源分配管理
专知会员服务
87+阅读 · 2022年5月6日
DeepMind提出强化学习新方法,可实现人机合作
关于强化学习(附代码,练习和解答)
深度学习
38+阅读 · 2018年1月30日
国家自然科学基金
17+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
96+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年8月15日
Arxiv
11+阅读 · 2021年12月8日
Optimization for deep learning: theory and algorithms
Arxiv
106+阅读 · 2019年12月19日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
3+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
6+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 6月17日
相关VIP内容
使用博弈论进行国防资源分配管理
专知会员服务
87+阅读 · 2022年5月6日
相关基金
国家自然科学基金
17+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
96+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
国家自然科学基金
2+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员