Extrinsic dexterity leverages environmental contact to overcome the limitations of prehensile manipulation. However, achieving such dexterity in cluttered scenes remains challenging and underexplored, as it requires selectively exploiting contact among multiple interacting objects with inherently coupled dynamics. Existing approaches lack explicit modeling of such complex dynamics and therefore fall short in non-prehensile manipulation in cluttered environments, which in turn limits their practical applicability in real-world environments. In this paper, we introduce a Dynamics-Aware Policy Learning (DAPL) framework that can facilitate policy learning with a learned representation of contact-induced object dynamics in cluttered environments. This representation is learned through explicit world modeling and used to condition reinforcement learning, enabling extrinsic dexterity to emerge without hand-crafted contact heuristics or complex reward shaping. We evaluate our approach in both simulation and the real world. Our method outperforms prehensile manipulation, human teleoperation, and prior representation-based policies by over 25% in success rate on unseen simulated cluttered scenes with varying densities. The real-world success rate reaches around 50% across 10 cluttered scenes, while a practical grocery deployment further demonstrates robust sim-to-real transfer and applicability.


翻译:外在灵巧性利用环境接触来克服抓取式操作的局限性。然而,在杂乱场景中实现这种灵巧性仍然具有挑战性且研究不足,因为它需要在多个具有内在耦合动力学的交互物体之间选择性地利用接触。现有方法缺乏对此类复杂动力学的显式建模,因此在杂乱环境中的非抓取式操作方面表现不足,这反过来限制了其在现实环境中的实际适用性。本文提出了一种动力学感知策略学习框架,该框架能够通过在杂乱环境中学习接触引发的物体动力学表示来促进策略学习。该表示通过显式的世界建模学习获得,并用于条件化强化学习,从而使外在灵巧性得以涌现,而无需手工设计的接触启发式规则或复杂的奖励塑形。我们在仿真和现实世界中对所提方法进行了评估。在具有不同密度的未见杂乱仿真场景中,我们的方法在成功率上优于抓取式操作、人类遥操作以及先前的基于表示的策略超过25%。在10个杂乱现实场景中,成功率达到了约50%,而一项实际的杂货部署进一步证明了稳健的仿真到现实迁移能力及适用性。

0
下载
关闭预览

相关内容

神经复杂性经典综述:涌现的复杂神经动力学
专知会员服务
39+阅读 · 2024年1月23日
【CMU博士论文】强化学习的泛化灵巧性,182页pdf
专知会员服务
41+阅读 · 2023年11月4日
《用于空战机动的分层多智能体强化学习》
专知会员服务
68+阅读 · 2023年10月5日
基于内在动机的深度强化学习探索方法综述
专知会员服务
40+阅读 · 2023年5月13日
专知会员服务
10+阅读 · 2020年11月12日
赛尔笔记 | Attention!注意力机制可解释吗?
哈工大SCIR
23+阅读 · 2019年9月27日
注意力机制(Attention)最新综述论文及相关源码
人工智能学家
30+阅读 · 2018年11月17日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员