A Novel Framework for Uncertainty-Driven Adaptive Exploration - 专知论文

会员服务 ·

0

自适应 · 不确定 · 不确定性 · 序列 · 系统 ·

A Novel Framework for Uncertainty-Driven Adaptive Exploration

翻译：一种基于不确定性的自适应探索新框架

Leonidas Bakopoulos,Georgios Chalkiadakis

from arxiv, This is an extended version (full paper + appendix) of the paper titled "A Novel Framework for Uncertainty-Driven Adaptive Exploration" accepted as a full paper at AAMAS 2026. The accepted paper can be found in https://openreview.net/forum?id=j5awxzdsU9

Adaptive exploration methods propose ways to learn complex policies via alternating between exploration and exploitation. An important question for such methods is to determine the appropriate moment to switch between exploration and exploitation and vice versa. This is critical in domains that require the learning of long and complex sequences of actions. In this work, we present a generic adaptive exploration framework that employs uncertainty to address this important issue in a principled manner. Our framework includes previous adaptive exploration approaches as special cases. Moreover, we can incorporate in our framework any uncertainty-measuring mechanism of choice, for instance mechanisms used in intrinsic motivation or epistemic uncertainty-based exploration methods. We experimentally demonstrate that our framework gives rise to adaptive exploration strategies that outperform standard ones across several environments.

翻译：自适应探索方法提出了通过交替进行探索与利用来学习复杂策略的途径。此类方法面临的一个关键问题在于如何确定在探索与利用之间切换的适宜时机，这在需要学习长序列复杂动作的领域中尤为重要。本研究提出了一种通用的自适应探索框架，该框架以不确定性为驱动，以系统化方式解决这一核心问题。我们的框架将既往的自适应探索方法涵盖为特例，并能够整合任选的不确定性度量机制，例如内在激励或认知不确定性探索方法中采用的机制。实验结果表明，本框架衍生的自适应探索策略在多种测试环境中均优于传统方法。

0

相关内容

自适应

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

52+阅读 · 2025年9月8日

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

专知会员服务

17+阅读 · 2025年8月18日

《不确定环境下的多智能体规划》141页

《不确定环境下的多智能体规划》141页

专知会员服务

65+阅读 · 2025年8月2日

《不确定性下的生成式模型适应性规划》

《不确定性下的生成式模型适应性规划》

专知会员服务

33+阅读 · 2024年8月8日

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

专知会员服务

38+阅读 · 2023年5月3日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

专知会员服务

35+阅读 · 2022年10月26日

【新书】【Metalearning】自动机器学习和数据挖掘的应用，Applications to Automated Machine Learning and Data Mining

【新书】【Metalearning】自动机器学习和数据挖掘的应用，Applications to Automated Machine Learning and Data Mining

专知会员服务

76+阅读 · 2022年3月24日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知会员服务

151+阅读 · 2021年1月18日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

10+阅读 · 2022年10月29日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

强化学习的两大话题之一，仍有极大探索空间

强化学习的两大话题之一，仍有极大探索空间

AI科技评论

22+阅读 · 2020年8月22日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

告别调参，AutoML新书发布

告别调参，AutoML新书发布

专知

14+阅读 · 2018年10月16日

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

属性驱动的自适应多agent系统设计关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Distributional Uncertainty and Adaptive Decision-Making in System

Arxiv

0+阅读 · 3月14日

Constructing Evidence-Based Tailoring Variables for Adaptive Interventions

Arxiv

0+阅读 · 3月9日

Uncertainty-Aware Calculation of Analytical Gradients of Matrix-Interpolatory Reduced-Order Models for Efficient Structural Optimization

Arxiv

0+阅读 · 2月26日

Adaptive Evolutionary Framework for Safe, Efficient, and Cooperative Autonomous Vehicle Interactions

Arxiv

0+阅读 · 2月24日

SelfAI: A self-directed framework for long-horizon scientific discovery

Arxiv

0+阅读 · 2月22日

Uncertainty Estimation by Flexible Evidential Deep Learning

Arxiv

0+阅读 · 2月20日

AdaGrad-Diff: A New Version of the Adaptive Gradient Algorithm

Arxiv

0+阅读 · 2月13日

Constructing Evidence-Based Tailoring Variables for Adaptive Interventions

Arxiv

0+阅读 · 2月10日

Bifrost: Steering Strategic Trajectories to Bridge Contextual Gaps for Self-Improving Agents

Arxiv

0+阅读 · 2月5日

Uncertainty-driven Adaptive Exploration

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

最新内容

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

10+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

5+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

6+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

7+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

10+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

8+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

10+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

10+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

6+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

5+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

8+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

6+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

7+阅读 · 7月17日

相关VIP内容

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

52+阅读 · 2025年9月8日

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

专知会员服务

17+阅读 · 2025年8月18日

《不确定环境下的多智能体规划》141页

《不确定环境下的多智能体规划》141页

专知会员服务

65+阅读 · 2025年8月2日

《不确定性下的生成式模型适应性规划》

《不确定性下的生成式模型适应性规划》

专知会员服务

33+阅读 · 2024年8月8日

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

专知会员服务

38+阅读 · 2023年5月3日

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

【牛津大学博士论文】深度学习中的结构与不确定性，205页pdf

专知会员服务

78+阅读 · 2022年11月9日

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

《不确定性下的国防能力组合选择》2022最新41页技术报告，加拿大国防研究与发展部

专知会员服务

35+阅读 · 2022年10月26日

【新书】【Metalearning】自动机器学习和数据挖掘的应用，Applications to Automated Machine Learning and Data Mining

【新书】【Metalearning】自动机器学习和数据挖掘的应用，Applications to Automated Machine Learning and Data Mining

专知会员服务

76+阅读 · 2022年3月24日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知会员服务

151+阅读 · 2021年1月18日

热门VIP内容

开通专知VIP会员享更多权益服务

锻造未来士兵：外骨骼、基因工程与赛博格

《无人机蜂群通信技术研究》50页

深入Project Maven：为何人工智能在战场上依然失灵

《无人机系统（UAS）通信网状网络试验性部署》50页报告

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

10+阅读 · 2022年10月29日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

强化学习的两大话题之一，仍有极大探索空间

强化学习的两大话题之一，仍有极大探索空间

AI科技评论

22+阅读 · 2020年8月22日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

告别调参，AutoML新书发布

告别调参，AutoML新书发布

专知

14+阅读 · 2018年10月16日

相关论文

Distributional Uncertainty and Adaptive Decision-Making in System

Arxiv

0+阅读 · 3月14日

Constructing Evidence-Based Tailoring Variables for Adaptive Interventions

Arxiv

0+阅读 · 3月9日

Uncertainty-Aware Calculation of Analytical Gradients of Matrix-Interpolatory Reduced-Order Models for Efficient Structural Optimization

Arxiv

0+阅读 · 2月26日

Adaptive Evolutionary Framework for Safe, Efficient, and Cooperative Autonomous Vehicle Interactions

Arxiv

0+阅读 · 2月24日

SelfAI: A self-directed framework for long-horizon scientific discovery

Arxiv

0+阅读 · 2月22日

Uncertainty Estimation by Flexible Evidential Deep Learning

Arxiv

0+阅读 · 2月20日

AdaGrad-Diff: A New Version of the Adaptive Gradient Algorithm

Arxiv

0+阅读 · 2月13日

Constructing Evidence-Based Tailoring Variables for Adaptive Interventions

Arxiv

0+阅读 · 2月10日

Bifrost: Steering Strategic Trajectories to Bridge Contextual Gaps for Self-Improving Agents

Arxiv

0+阅读 · 2月5日

Uncertainty-driven Adaptive Exploration

Arxiv

0+阅读 · 2月3日

相关基金

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

属性驱动的自适应多agent系统设计关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员