Learning from demonstration has proved itself useful for teaching robots complex skills with high sample efficiency. However, teaching long-horizon tasks with multiple skills is challenging as deviations tend to accumulate, the distributional shift becomes more evident, and human teachers become fatigued over time, thereby increasing the likelihood of failure. To address these challenges, we introduce $(ST)^2$, a sequential method for learning long-horizon manipulation tasks that allows users to control the teaching flow by specifying key points, enabling structured and incremental demonstrations. Using this framework, we study how users respond to two teaching paradigms: (i) a traditional monolithic approach, in which users demonstrate the entire task trajectory at once, and (ii) a sequential approach, in which the task is segmented and demonstrated step by step. We conducted an extensive user study on the restocking task with $16$ participants in a realistic retail store environment, evaluating the user preferences and effectiveness of the methods. User-level analysis showed superior performance for the sequential approach in most cases (10 users), compared with the monolithic approach (5 users), with one tie. Our subjective results indicate that some teachers prefer sequential teaching -- as it allows them to teach complicated tasks iteratively -- or others prefer teaching in one go due to its simplicity.


翻译:从演示中学习已被证明能以高样本效率教授机器人复杂技能。然而,教授包含多项技能的长期任务具有挑战性,因为偏差容易累积、分布偏移更为明显,且人类教师会随时间推移感到疲劳,从而增加失败的可能性。为应对这些挑战,我们提出了$(ST)^2$——一种学习长时程操作任务的序列化方法,允许用户通过指定关键点来控制教学流程,实现结构化、渐进式的演示。利用该框架,我们研究了用户对两种教学范式的反应:(i)传统的整体式方法,即用户一次性演示整个任务轨迹;(ii)序列化方法,即将任务分段并逐步演示。我们在一个真实的零售店环境中,针对补货任务开展了包含16名参与者的广泛用户研究,评估了用户偏好与方法的有效性。用户层面分析表明,在多数情况下(10名用户),序列化方法相比整体式方法(5名用户)表现出更优性能,另有一例持平。我们的主观结果显示,部分教师偏好序列化教学——因其允许他们迭代式教授复杂任务,而其他教师则因其简便性倾向于一次性完成教学。

0
下载
关闭预览

相关内容

数学上,序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。
机器人领域的多任务泛化研究
专知会员服务
16+阅读 · 1月14日
生成式人工智能在机器人操作中的应用:综述
专知会员服务
29+阅读 · 2025年3月6日
《协作机器人的学习行为树》最新146页博士论文
专知会员服务
48+阅读 · 2024年2月7日
专知会员服务
17+阅读 · 2021年7月26日
首篇「课程学习(Curriculum Learning)」2021综述论文
专知会员服务
50+阅读 · 2021年1月31日
【机器学习课程】机器学习中的常识性问题
专知会员服务
75+阅读 · 2019年12月2日
清华大学《高级机器学习》课程
专知
40+阅读 · 2020年7月21日
使用强化学习训练机械臂完成人类任务
AI研习社
14+阅读 · 2019年3月23日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
第二章 机器学习中的数学基础
Datartisan数据工匠
12+阅读 · 2018年4月5日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员