Despite its promise, imitation learning often fails in long-horizon environments where perfect replication of demonstrations is unrealistic and small errors can accumulate catastrophically. We introduce Cago (Capability-Aware Goal Sampling), a novel learning-from-demonstrations method that mitigates the brittle dependence on expert trajectories for direct imitation. Unlike prior methods that rely on demonstrations only for policy initialization or reward shaping, Cago dynamically tracks the agent's competence along expert trajectories and uses this signal to select intermediate steps--goals that are just beyond the agent's current reach--to guide learning. This results in an adaptive curriculum that enables steady progress toward solving the full task. Empirical results demonstrate that Cago significantly improves sample efficiency and final performance across a range of sparse-reward, goal-conditioned tasks, consistently outperforming existing learning from-demonstrations baselines.


翻译:尽管模仿学习前景广阔,但在长视野环境中往往失败,因为完美复现演示是不现实的,且微小误差可能灾难性地累积。我们提出Cago(能力感知目标采样),一种新颖的演示学习方法,旨在缓解直接模仿对专家轨迹的脆弱依赖。与先前仅将演示用于策略初始化或奖励塑形的方法不同,Cago动态追踪智能体沿专家轨迹的能力,并利用该信号选择中间步骤——即刚好超出智能体当前能力范围的目标——来引导学习。这形成了一种自适应课程,使智能体能够稳步推进完整任务的求解。实证结果表明,在一系列稀疏奖励、目标条件任务中,Cago显著提升了样本效率和最终性能,持续优于现有的演示学习基线方法。

0
下载
关闭预览

相关内容

视觉提示学习综述
专知会员服务
55+阅读 · 2024年3月23日
【ICML2022】通过评估演示者的专业知识进行模仿学习
专知会员服务
17+阅读 · 2022年7月18日
专知会员服务
20+阅读 · 2021年8月30日
专知会员服务
48+阅读 · 2021年7月2日
可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
132+阅读 · 2020年5月14日
论文浅尝|简单高效的知识图谱表示学习负样本采样方法
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月15日
VIP会员
相关基金
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员