第19届智能体及多智能体系统国际会议(International Joint Conference on Autonomous Agents and Multi-Agent Systems, AAMAS-2020)近日在线举行。智能体及多智能体系统国际会议(AAMAS) 是多智能体系统领域最具影响力的会议之一,由非营利组织IFAAMAS主办。今年,AAMAS-2020共收到808篇论文投稿,录用186篇。

我们回顾了在无模型和基于模型的强化学习设置中的残差算法。我们提出了双向目标网络技术来稳定残差算法,生成一个在DeepMind控制套件基准测试中显著优于普通DDPG的DDPG的残差版本。此外,我们发现残差算法是解决基于模型规划中分布不匹配问题的有效方法。与现有的TD(k)方法相比,我们基于残差的方法对模型的假设更弱,并产生了更大的性能提升。

成为VIP会员查看完整内容
45

相关内容

[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
36+阅读 · 2020年7月5日
元学习(meta learning) 最新进展综述论文
专知会员服务
281+阅读 · 2020年5月8日
近期强化学习领域论文导读(附源码)
人工智能前沿讲习班
7+阅读 · 2019年6月15日
【学界】DeepMind论文:深度压缩感知,新框架提升GAN性能
GAN生成式对抗网络
14+阅读 · 2019年5月23日
DeepMind论文:深度压缩感知,新框架提升GAN性能
极市平台
4+阅读 · 2019年5月23日
ICLR2019最佳论文出炉
专知
12+阅读 · 2019年5月6日
【ICLR 2019录用结果出炉】24篇Oral, 918被拒
专知
7+阅读 · 2018年12月21日
Arxiv
6+阅读 · 2019年7月11日
Arxiv
22+阅读 · 2018年8月30日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
5+阅读 · 2018年3月28日
VIP会员
最新内容
AutoScientists:自组织智能体团队驱动长期科学实验
战略前沿人工智能的再思考(中文)
专知会员服务
2+阅读 · 今天14:53
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
2+阅读 · 今天14:51
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
2+阅读 · 今天14:38
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
13+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关VIP内容
[ICML-Google]先宽后窄:对深度薄网络的有效训练
专知会员服务
36+阅读 · 2020年7月5日
元学习(meta learning) 最新进展综述论文
专知会员服务
281+阅读 · 2020年5月8日
相关资讯
相关论文
Arxiv
6+阅读 · 2019年7月11日
Arxiv
22+阅读 · 2018年8月30日
Relational Deep Reinforcement Learning
Arxiv
10+阅读 · 2018年6月28日
A Multi-Objective Deep Reinforcement Learning Framework
Arxiv
5+阅读 · 2018年3月28日
微信扫码咨询专知VIP会员