这项工作的目的是开发能够成功处理复杂动态环境中顺序决策的深度终身学习方法,重点是多Agent情报、监视和侦察(ISR)场景。我们为深度卷积神经网络开发了一个新的架构,支持通过去卷积因子化的终身学习(DF-CNN),探索了通过Distral和Sobolev训练的策略提炼的组合,并开发了一个混合控制器,将深度学习应用于ISR智能体。我们的方法在标准基准深度学习数据集、DOOM环境和ATE3模拟环境中的ISR场景中进行了评估。

我们的主要贡献是反卷积因子卷积神经网络(DFCNN)。DF-CNN框架调整了标准卷积神经网络(CNN)框架,以实现任务之间的转移。它在每个CNN层维护一个共享知识库,并通过这个共享知识促进不同任务的CNN之间的转移。每个具体任务的CNN模型的各个过滤层都是由这个共享知识库重建的,随着网络在多个任务中的训练,这个知识库会随着时间的推移而调整。DF-CNN代表了ELLA终身学习框架对深度网络的概括。

实验表明,DF-CNN在终身中的基准识别任务上的表现优于其他方法(包括单任务学习、低层的硬参数共享和渐进式神经网络)。此外,该框架能够抵抗灾难性遗忘,同时仍然允许从未来的学习中反向转移到以前学习的模型。

对于深度强化学习,我们研究了将Sobolev训练整合到Distral多任务框架中,以努力改善转移和训练,探索了DF-CNN在深度RL中的应用,并开发了一个混合控制器,将本地学习的深度RL策略结合在一起,在ATE3仿真环境中完成ISR场景。

成为VIP会员查看完整内容
45

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《 美国国防部:反小​​型无人机系统战略》38页报告
专知会员服务
278+阅读 · 2022年8月12日
美国国防部《联合全域指挥与控制(JADC2)战略概要》
专知会员服务
326+阅读 · 2022年6月13日
美国国防部《指挥、控制和通信 (C3)现代化战略 》
专知会员服务
229+阅读 · 2022年5月9日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
36+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
8+阅读 · 2009年12月31日
Adversarial Examples in Constrained Domains
Arxiv
0+阅读 · 2022年9月9日
Arxiv
0+阅读 · 2022年9月8日
Arxiv
0+阅读 · 2022年9月7日
VIP会员
最新内容
AutoScientists:自组织智能体团队驱动长期科学实验
战略前沿人工智能的再思考(中文)
专知会员服务
3+阅读 · 今天14:53
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
3+阅读 · 今天14:51
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
2+阅读 · 今天14:38
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
13+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关VIP内容
《 美国国防部:反小​​型无人机系统战略》38页报告
专知会员服务
278+阅读 · 2022年8月12日
美国国防部《联合全域指挥与控制(JADC2)战略概要》
专知会员服务
326+阅读 · 2022年6月13日
美国国防部《指挥、控制和通信 (C3)现代化战略 》
专知会员服务
229+阅读 · 2022年5月9日
相关资讯
相关基金
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
36+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
8+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员