摘要

先进的任务规划软件包(如 AFSIM)使用传统的人工智能方法,包括分配算法和脚本状态机来控制军用飞机、舰船和地面单位的模拟行为。我们开发了一种新颖的 AI 系统,该系统使用强化学习为军事交战生成更有效的高级策略。然而,它不是从头开始学习具有初始随机行为的策略,而是利用现有的传统 AI 方法来自动化简单的低级行为,简化问题的协作多智能体方面,并利用可用的先验知识引导学习以实现数量级更快的训练。

图 1 - 涉及空中、海上和地面单位的复杂 AFSIM 场景示例。分析师必须对所有这些平台进行建模,并使用基于规则的系统指定它们的行为。

图 2 - 我们最初探索的 AFSIM 场景的概念图。许多红色和蓝色的战斗机被放置在地图上的随机位置。基线脚本 AI 用于控制红队,我们的新混合 RL 智能体学习击败红队的策略。

图 3 - 简化的 MA2D 环境,完全用 Python 编写。此示例包含两个蓝色战斗机和两个红色战斗机。深灰色区域代表每个单位的武器区域。目标是通过让每个对手进入该区域来摧毁所有对手,同时避免类似地摧毁友军飞机。这种简化消除了对导弹飞行建模的需要。

图 4 - 我们的混合架构概述,将高级强化学习器与低级脚本行为策略配对。强化学习代理选择脚本行为,然后生成发送到环境的实际控制输出。

成为VIP会员查看完整内容
236

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
专知会员服务
170+阅读 · 2021年8月3日
五分钟教你在Go-Bigger中设计自己的游戏AI智能体
THU数据派
5+阅读 · 2021年11月5日
强化学习开篇:Q-Learning原理详解
AINLP
37+阅读 · 2020年7月28日
层级强化学习概念简介
CreateAMind
21+阅读 · 2019年6月9日
使用强化学习训练机械臂完成人类任务
AI研习社
14+阅读 · 2019年3月23日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
11+阅读 · 2018年4月25日
VIP会员
最新内容
【剑桥博士论文】智能体-环境协同优化
专知会员服务
3+阅读 · 今天14:33
为初级军官战术训练设计生成式人工智能平台
专知会员服务
4+阅读 · 今天6:43
《美军条令:作战伤员后送保障》
专知会员服务
4+阅读 · 今天6:38
《美空军条令出版物 4-0,维持》
专知会员服务
4+阅读 · 今天6:32
《基于仿真的空军任务规划优化》
专知会员服务
3+阅读 · 今天6:21
相关VIP内容
专知会员服务
170+阅读 · 2021年8月3日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
3+阅读 · 2011年12月31日
国家自然科学基金
3+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员