Adaptive exploration methods propose ways to learn complex policies via alternating between exploration and exploitation. An important question for such methods is to determine the appropriate moment to switch between exploration and exploitation and vice versa. This is critical in domains that require the learning of long and complex sequences of actions. In this work, we present a generic adaptive exploration framework that employs uncertainty to address this important issue in a principled manner. Our framework includes previous adaptive exploration approaches as special cases. Moreover, we can incorporate in our framework any uncertainty-measuring mechanism of choice, for instance mechanisms used in intrinsic motivation or epistemic uncertainty-based exploration methods. We experimentally demonstrate that our framework gives rise to adaptive exploration strategies that outperform standard ones across several environments.


翻译:自适应探索方法提出了通过交替进行探索与利用来学习复杂策略的途径。这类方法的一个关键问题在于如何确定在探索与利用之间切换的适宜时机,这对于需要学习长序列复杂动作的领域尤为重要。本研究提出了一种通用的自适应探索框架,该框架以不确定性为驱动,以系统化的方式解决这一重要问题。我们的框架将以往的自适应探索方法纳入作为特例。此外,框架可兼容任选的不确定性度量机制,例如内在激励或基于认知不确定性的探索方法所采用的机制。实验结果表明,本框架衍生的自适应探索策略在多种环境中均优于传统方法。

0
下载
关闭预览

相关内容

《不确定环境下的多智能体规划》141页
专知会员服务
63+阅读 · 2025年8月2日
《不确定性下的生成式模型适应性规划》
专知会员服务
32+阅读 · 2024年8月8日
领域自适应研究综述
专知会员服务
55+阅读 · 2021年5月5日
强化学习的两大话题之一,仍有极大探索空间
AI科技评论
22+阅读 · 2020年8月22日
【资源】领域自适应相关论文、代码分享
专知
32+阅读 · 2019年10月12日
迁移自适应学习最新综述,附21页论文下载
领域自适应学习论文大列表
专知
71+阅读 · 2019年3月2日
告别调参,AutoML新书发布
专知
14+阅读 · 2018年10月16日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
50+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2月3日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
50+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员