不确定性驱动的自适应探索 (Uncertainty-driven Adaptive Exploration) - 专知论文

会员服务 ·

0

自适应 · 不确定 · 不确定性 · 序列 · 系统 ·

Uncertainty-driven Adaptive Exploration

翻译：不确定性驱动的自适应探索

Leonidas Bakopoulos,Georgios Chalkiadakis

from arxiv, This is an extended version of the paper titled "A Novel Framework for Uncertainty-Driven Adaptive Exploration" accepted as a full paper at AAMAS 2026. The accepted paper can be found in https://openreview.net/forum?id=j5awxzdsU9

Adaptive exploration methods propose ways to learn complex policies via alternating between exploration and exploitation. An important question for such methods is to determine the appropriate moment to switch between exploration and exploitation and vice versa. This is critical in domains that require the learning of long and complex sequences of actions. In this work, we present a generic adaptive exploration framework that employs uncertainty to address this important issue in a principled manner. Our framework includes previous adaptive exploration approaches as special cases. Moreover, we can incorporate in our framework any uncertainty-measuring mechanism of choice, for instance mechanisms used in intrinsic motivation or epistemic uncertainty-based exploration methods. We experimentally demonstrate that our framework gives rise to adaptive exploration strategies that outperform standard ones across several environments.

翻译：自适应探索方法提出了通过交替进行探索与利用来学习复杂策略的途径。此类方法面临的一个关键问题在于确定何时在探索与利用之间进行切换，反之亦然。这在需要学习长而复杂动作序列的领域中尤为重要。本研究提出了一种通用的自适应探索框架，该框架以不确定性为驱动，以系统化的方式解决这一重要问题。我们的框架将先前的自适应探索方法涵盖为特例。此外，该框架可整合任意选择的不确定性度量机制，例如内在激励或基于认知不确定性的探索方法所采用的机制。实验结果表明，我们的框架所产生的自适应探索策略在多种环境中均优于标准方法。

0

相关内容

自适应

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

47+阅读 · 2025年9月8日

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

专知会员服务

17+阅读 · 2025年8月18日

《不确定环境下的多智能体规划》141页

《不确定环境下的多智能体规划》141页

专知会员服务

63+阅读 · 2025年8月2日

《不确定性下的生成式模型适应性规划》

《不确定性下的生成式模型适应性规划》

专知会员服务

32+阅读 · 2024年8月8日

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

专知会员服务

38+阅读 · 2023年5月3日

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

专知会员服务

108+阅读 · 2022年6月17日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

基于人工智能的自适应实验设计, 加州理工Yisong Yue教授，附下载

专知会员服务

20+阅读 · 2021年1月27日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知会员服务

151+阅读 · 2021年1月18日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

【CVPR2023】探索和利用不确定性的不完整多视角分类

【CVPR2023】探索和利用不确定性的不完整多视角分类

专知

42+阅读 · 2023年4月13日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

10+阅读 · 2022年10月29日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

探索(Exploration)还是利用(Exploitation)？强化学习如何tradeoff？

探索(Exploration)还是利用(Exploitation)？强化学习如何tradeoff？

深度强化学习实验室

13+阅读 · 2020年8月23日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

基于自适应学习平台促进学生个性化学习的研究

基于自适应学习平台促进学生个性化学习的研究

MOOC

12+阅读 · 2018年4月2日

极市分享|王晋东迁移学习中的领域自适应方法

极市分享|王晋东迁移学习中的领域自适应方法

极市平台

10+阅读 · 2017年12月11日

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

计及多重-复合不确定性的电力系统稳定约束优化调度研究

国家自然科学基金

1+阅读 · 2016年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

50+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

属性驱动的自适应多agent系统设计关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下基于HTN的应急任务规划方法研究

国家自然科学基金

15+阅读 · 2012年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

A Novel Framework for Uncertainty-Driven Adaptive Exploration

Arxiv

0+阅读 · 2月4日

Uncertainty-Aware Knowledge Tracing Models

Arxiv

0+阅读 · 2月2日

AdaptNC: Adaptive Nonconformity Scores for Uncertainty-Aware Autonomous Systems in Dynamic Environments

Arxiv

0+阅读 · 2月2日

Smart Exploration in Reinforcement Learning using Bounded Uncertainty Models

Arxiv

0+阅读 · 1月28日

Who Is Responsible? Self-Adaptation Under Multiple Concurrent Uncertainties With Unknown Sources in Complex ROS-Based Systems

Arxiv

0+阅读 · 1月25日

Who Is Responsible? Self-Adaptation Under Multiple Concurrent Uncertainties With Unknown Sources in Complex ROS-Based Systems

Arxiv

0+阅读 · 1月21日

Spatially Generalizable Mobile Manipulation via Adaptive Experience Selection and Dynamic Imagination

Arxiv

0+阅读 · 1月21日

Adaptive Conditional Contrast-Agnostic Deformable Image Registration with Uncertainty Estimation

Arxiv

0+阅读 · 1月9日

Adaptive Retrieval for Reasoning-Intensive Retrieval

Arxiv

0+阅读 · 1月8日

Adaptive Learning Guided by Bias-Noise-Alignment Diagnostics

Arxiv

0+阅读 · 2025年12月30日

VIP会员

文章信息

相关主题

相关VIP内容

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

47+阅读 · 2025年9月8日

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

【CMU博士论文】交互式学习的进展：替代性反馈机制与自适应因果推理

专知会员服务

17+阅读 · 2025年8月18日

《不确定环境下的多智能体规划》141页

《不确定环境下的多智能体规划》141页

专知会员服务

63+阅读 · 2025年8月2日

《不确定性下的生成式模型适应性规划》

《不确定性下的生成式模型适应性规划》

专知会员服务

32+阅读 · 2024年8月8日

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

【MIT博士论文】不确定环境下自主系统的风险感知规划与概率预测，166页pdf

专知会员服务

38+阅读 · 2023年5月3日

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

专知会员服务

108+阅读 · 2022年6月17日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

基于人工智能的自适应实验设计, 加州理工Yisong Yue教授，附下载

专知会员服务

20+阅读 · 2021年1月27日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知会员服务

151+阅读 · 2021年1月18日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

AI智能体时代大模型安全风险与攻防新挑战

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

相关资讯

【CVPR2023】探索和利用不确定性的不完整多视角分类

【CVPR2023】探索和利用不确定性的不完整多视角分类

专知

42+阅读 · 2023年4月13日

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

【苏黎世联邦理工博士论文】神经系统中的知识不确定性与终身学习，179页pdf

专知

10+阅读 · 2022年10月29日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

探索(Exploration)还是利用(Exploitation)？强化学习如何tradeoff？

探索(Exploration)还是利用(Exploitation)？强化学习如何tradeoff？

深度强化学习实验室

13+阅读 · 2020年8月23日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

基于自适应学习平台促进学生个性化学习的研究

基于自适应学习平台促进学生个性化学习的研究

MOOC

12+阅读 · 2018年4月2日

极市分享|王晋东迁移学习中的领域自适应方法

极市分享|王晋东迁移学习中的领域自适应方法

极市平台

10+阅读 · 2017年12月11日

相关论文

A Novel Framework for Uncertainty-Driven Adaptive Exploration

Arxiv

0+阅读 · 2月4日

Uncertainty-Aware Knowledge Tracing Models

Arxiv

0+阅读 · 2月2日

AdaptNC: Adaptive Nonconformity Scores for Uncertainty-Aware Autonomous Systems in Dynamic Environments

Arxiv

0+阅读 · 2月2日

Smart Exploration in Reinforcement Learning using Bounded Uncertainty Models

Arxiv

0+阅读 · 1月28日

Who Is Responsible? Self-Adaptation Under Multiple Concurrent Uncertainties With Unknown Sources in Complex ROS-Based Systems

Arxiv

0+阅读 · 1月25日

Who Is Responsible? Self-Adaptation Under Multiple Concurrent Uncertainties With Unknown Sources in Complex ROS-Based Systems

Arxiv

0+阅读 · 1月21日

Spatially Generalizable Mobile Manipulation via Adaptive Experience Selection and Dynamic Imagination

Arxiv

0+阅读 · 1月21日

Adaptive Conditional Contrast-Agnostic Deformable Image Registration with Uncertainty Estimation

Arxiv

0+阅读 · 1月9日

Adaptive Retrieval for Reasoning-Intensive Retrieval

Arxiv

0+阅读 · 1月8日

Adaptive Learning Guided by Bias-Noise-Alignment Diagnostics

Arxiv

0+阅读 · 2025年12月30日

相关基金

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

计及多重-复合不确定性的电力系统稳定约束优化调度研究

国家自然科学基金

1+阅读 · 2016年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

50+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

属性驱动的自适应多agent系统设计关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向主体行为网的自适应作战机理研究

国家自然科学基金

24+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下基于HTN的应急任务规划方法研究

国家自然科学基金

15+阅读 · 2012年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员