Sim-to-real transfer for contact-rich manipulation remains challenging due to the inherent discrepancy in contact dynamics. While existing methods often rely on costly real-world data or utilize blind compliance through fixed controllers, we propose a framework that leverages expert-designed controller logic for transfer. Inspired by the success of privileged supervision in kinematic tasks, we employ a human-designed finite state machine based position/force controller in simulation to provide privileged guidance. The resulting policy is trained to predict the end-effector pose, contact state, and crucially the desired contact force direction. Unlike force magnitudes, which are highly sensitive to simulation inaccuracies, force directions encode high-level task geometry and remain robust across the sim-to-real gap. At deployment, these predictions configure a force-aware admittance controller. By combining the policy's directional intent with a constant, low-cost manually tuned force magnitude, the system generates adaptive, task-aligned compliance. This tuning is lightweight, typically requiring only a single scalar per contact state. We provide theoretical analysis for stability and robustness to disturbances. Experiments on four real-world tasks, i.e., microwave opening, peg-in-hole, whiteboard wiping, and door opening, demonstrate that our approach significantly outperforms strong baselines in both success rate and robustness. Videos are available at: https://yifei-y.github.io/project-pages/DirectionMatters/.


翻译:由于接触动力学固有的差异,接触式操作的仿真到现实迁移仍然具有挑战性。现有方法通常依赖昂贵的真实世界数据,或通过固定控制器利用盲从顺应性,而我们提出了一个利用专家设计的控制器逻辑进行迁移的框架。受运动学任务中特权监督成功的启发,我们在仿真中使用基于人工设计有限状态机的位置/力控制器来提供特权指导。由此训练出的策略能够预测末端执行器位姿、接触状态,以及至关重要的期望接触力方向。与对仿真误差高度敏感的力大小不同,力方向编码了高层任务几何信息,并在仿真到现实的差距中保持鲁棒性。在部署时,这些预测用于配置一个力感知导纳控制器。通过将策略的方向意图与一个恒定、低成本的手动调整力大小相结合,系统能够生成自适应的、与任务对齐的顺应性。这种调整是轻量级的,通常每个接触状态仅需一个标量。我们提供了关于稳定性和对干扰鲁棒性的理论分析。在四个真实世界任务(即微波炉开门、孔轴装配、白板擦拭和开门)上的实验表明,我们的方法在成功率和鲁棒性方面均显著优于强基线。视频可见于:https://yifei-y.github.io/project-pages/DirectionMatters/。

0
下载
关闭预览

相关内容

深度强化学习与模仿学习导论
专知会员服务
25+阅读 · 2025年12月10日
【斯坦福博士论文】移动操作机器人的学习系统构建研究
专知会员服务
14+阅读 · 2025年11月14日
《用于水下目标定位的平台便携式强化学习方法》
专知会员服务
27+阅读 · 2024年1月2日
专知会员服务
48+阅读 · 2021年7月2日
浅谈主动学习(Active Learning)
凡人机器学习
32+阅读 · 2020年6月18日
【深度学习】深度学习的核心:掌握训练数据的方法
产业智能官
12+阅读 · 2018年1月14日
迁移学习在深度学习中的应用
专知
24+阅读 · 2017年12月24日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员