A Novel Framework for Uncertainty-Driven Adaptive Exploration - 专知论文

会员服务 ·

0

自适应 · 不确定 · 不确定性 · 序列 · 系统 ·

A Novel Framework for Uncertainty-Driven Adaptive Exploration

翻译：一种基于不确定性的自适应探索新框架

Leonidas Bakopoulos,Georgios Chalkiadakis

from arxiv, This is an extended version (full paper + appendix) of the paper titled "A Novel Framework for Uncertainty-Driven Adaptive Exploration" accepted as a full paper at AAMAS 2026. The accepted paper can be found in https://openreview.net/forum?id=j5awxzdsU9

Adaptive exploration methods propose ways to learn complex policies via alternating between exploration and exploitation. An important question for such methods is to determine the appropriate moment to switch between exploration and exploitation and vice versa. This is critical in domains that require the learning of long and complex sequences of actions. In this work, we present a generic adaptive exploration framework that employs uncertainty to address this important issue in a principled manner. Our framework includes previous adaptive exploration approaches as special cases. Moreover, we can incorporate in our framework any uncertainty-measuring mechanism of choice, for instance mechanisms used in intrinsic motivation or epistemic uncertainty-based exploration methods. We experimentally demonstrate that our framework gives rise to adaptive exploration strategies that outperform standard ones across several environments.

翻译：自适应探索方法提出了通过交替进行探索与利用来学习复杂策略的途径。这类方法的一个关键问题在于如何确定在探索与利用之间切换的适宜时机，这对于需要学习长序列复杂动作的领域尤为重要。本研究提出了一种通用的自适应探索框架，该框架以不确定性为驱动，以系统化的方式解决这一重要问题。我们的框架将以往的自适应探索方法纳入作为特例。此外，框架可兼容任选的不确定性度量机制，例如内在激励或基于认知不确定性的探索方法所采用的机制。实验结果表明，本框架衍生的自适应探索策略在多种环境中均优于传统方法。

0

相关内容

自适应

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

52+阅读 · 2025年9月8日

《不确定环境下的多智能体规划》141页

《不确定环境下的多智能体规划》141页

专知会员服务

65+阅读 · 2025年8月2日

《不确定性下的生成式模型适应性规划》

《不确定性下的生成式模型适应性规划》

专知会员服务

33+阅读 · 2024年8月8日

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

专知会员服务

38+阅读 · 2023年5月3日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

专知会员服务

35+阅读 · 2022年10月26日

【新书】【Metalearning】自动机器学习和数据挖掘的应用，Applications to Automated Machine Learning and Data Mining

【新书】【Metalearning】自动机器学习和数据挖掘的应用，Applications to Automated Machine Learning and Data Mining

专知会员服务

76+阅读 · 2022年3月24日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

基于人工智能的自适应实验设计, 加州理工Yisong Yue教授，附下载

专知会员服务

21+阅读 · 2021年1月27日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知会员服务

151+阅读 · 2021年1月18日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

10+阅读 · 2022年10月29日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

强化学习的两大话题之一，仍有极大探索空间

强化学习的两大话题之一，仍有极大探索空间

AI科技评论

22+阅读 · 2020年8月22日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

告别调参，AutoML新书发布

告别调参，AutoML新书发布

专知

14+阅读 · 2018年10月16日

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

属性驱动的自适应多agent系统设计关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Distributional Uncertainty and Adaptive Decision-Making in System

Arxiv

0+阅读 · 3月14日

Constructing Evidence-Based Tailoring Variables for Adaptive Interventions

Arxiv

0+阅读 · 3月9日

Uncertainty-Aware Calculation of Analytical Gradients of Matrix-Interpolatory Reduced-Order Models for Efficient Structural Optimization

Arxiv

0+阅读 · 2月26日

SelfAI: A self-directed framework for long-horizon scientific discovery

Arxiv

0+阅读 · 2月22日

Uncertainty Estimation by Flexible Evidential Deep Learning

Arxiv

0+阅读 · 2月20日

AdaGrad-Diff: A New Version of the Adaptive Gradient Algorithm

Arxiv

0+阅读 · 2月13日

Constructing Evidence-Based Tailoring Variables for Adaptive Interventions

Arxiv

0+阅读 · 2月10日

HyPlan: Hybrid Learning-Assisted Planning Under Uncertainty for Safe Autonomous Driving

Arxiv

0+阅读 · 2月6日

Bifrost: Steering Strategic Trajectories to Bridge Contextual Gaps for Self-Improving Agents

Arxiv

0+阅读 · 2月5日

Uncertainty-driven Adaptive Exploration

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

最新内容

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

0+阅读 · 今天15:20

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

0+阅读 · 今天15:18

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

8+阅读 · 今天5:53

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

4+阅读 · 今天5:45

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

2+阅读 · 今天5:23

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

2+阅读 · 今天5:11

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

6+阅读 · 今天5:04

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

4+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

8+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

10+阅读 · 7月26日

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

专知会员服务

8+阅读 · 7月26日

《反无人机交战场景下的战斗归零研究》

《反无人机交战场景下的战斗归零研究》

专知会员服务

7+阅读 · 7月26日

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

专知会员服务

4+阅读 · 7月26日

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

5+阅读 · 7月25日

相关VIP内容

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

52+阅读 · 2025年9月8日

《不确定环境下的多智能体规划》141页

《不确定环境下的多智能体规划》141页

专知会员服务

65+阅读 · 2025年8月2日

《不确定性下的生成式模型适应性规划》

《不确定性下的生成式模型适应性规划》

专知会员服务

33+阅读 · 2024年8月8日

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

专知会员服务

38+阅读 · 2023年5月3日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

专知会员服务

35+阅读 · 2022年10月26日

【新书】【Metalearning】自动机器学习和数据挖掘的应用，Applications to Automated Machine Learning and Data Mining

【新书】【Metalearning】自动机器学习和数据挖掘的应用，Applications to Automated Machine Learning and Data Mining

专知会员服务

76+阅读 · 2022年3月24日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

基于人工智能的自适应实验设计, 加州理工Yisong Yue教授，附下载

专知会员服务

21+阅读 · 2021年1月27日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知会员服务

151+阅读 · 2021年1月18日

热门VIP内容

开通专知VIP会员享更多权益服务

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

美空军新型反无人机部队初探

博士论文 | 面向大模型推理的内存高效算法

《无人系统互操作性导论——无人系统联合架构（JAUS）》

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

10+阅读 · 2022年10月29日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

强化学习的两大话题之一，仍有极大探索空间

强化学习的两大话题之一，仍有极大探索空间

AI科技评论

22+阅读 · 2020年8月22日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

告别调参，AutoML新书发布

告别调参，AutoML新书发布

专知

14+阅读 · 2018年10月16日

相关论文

Distributional Uncertainty and Adaptive Decision-Making in System

Arxiv

0+阅读 · 3月14日

Constructing Evidence-Based Tailoring Variables for Adaptive Interventions

Arxiv

0+阅读 · 3月9日

Uncertainty-Aware Calculation of Analytical Gradients of Matrix-Interpolatory Reduced-Order Models for Efficient Structural Optimization

Arxiv

0+阅读 · 2月26日

SelfAI: A self-directed framework for long-horizon scientific discovery

Arxiv

0+阅读 · 2月22日

Uncertainty Estimation by Flexible Evidential Deep Learning

Arxiv

0+阅读 · 2月20日

AdaGrad-Diff: A New Version of the Adaptive Gradient Algorithm

Arxiv

0+阅读 · 2月13日

Constructing Evidence-Based Tailoring Variables for Adaptive Interventions

Arxiv

0+阅读 · 2月10日

HyPlan: Hybrid Learning-Assisted Planning Under Uncertainty for Safe Autonomous Driving

Arxiv

0+阅读 · 2月6日

Bifrost: Steering Strategic Trajectories to Bridge Contextual Gaps for Self-Improving Agents

Arxiv

0+阅读 · 2月5日

Uncertainty-driven Adaptive Exploration

Arxiv

0+阅读 · 2月3日

相关基金

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

属性驱动的自适应多agent系统设计关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员