We present an integrated (or end-to-end) framework for the Real2Sim2Real problem of manipulating deformable linear objects (DLOs) based on visual perception. Working with a parameterised set of DLOs, we use likelihood-free inference (LFI) to compute the posterior distributions for the physical parameters using which we can approximately simulate the behaviour of each specific DLO. We use these posteriors for domain randomisation while training, in simulation, object-specific visuomotor policies (i.e. assuming only visual and proprioceptive sensory) for a DLO reaching task, using model-free reinforcement learning. We demonstrate the utility of this approach by deploying sim-trained DLO manipulation policies in the real world in a zero-shot manner, i.e. without any further fine-tuning. In this context, we evaluate the capacity of a prominent LFI method to perform fine classification over the parametric set of DLOs, using only visual and proprioceptive data obtained in a dynamic manipulation trajectory. We then study the implications of the resulting domain distributions in sim-based policy learning and real-world performance.


翻译:我们提出了一种用于解决基于视觉感知的可变形线性物体操控的Real2Sim2Real问题的集成(即端到端)框架。针对一组参数化的DLO,我们采用无似然推断来推算物理参数的后验分布,利用这些分布可以近似模拟每个具体DLO的行为。在训练过程中,我们使用这些后验分布进行领域随机化,在仿真环境中通过无模型强化学习,为DLO到达任务训练物体特定的视觉运动策略(即仅假设具备视觉和本体感觉感知能力)。我们通过以零样本方式(即无需任何进一步微调)将仿真训练的DLO操控策略部署到现实世界,展示了该方法的实用性。在此背景下,我们评估了一种主流LFI方法在仅使用动态操控轨迹中获取的视觉和本体感觉数据时,对参数化DLO集合执行精细分类的能力。随后,我们研究了所得领域分布在基于仿真的策略学习及现实世界性能中的影响。

0
下载
关闭预览

相关内容

智能体适应
专知会员服务
25+阅读 · 2025年12月11日
《分布式多智能体强化学习策略的可解释性研究》
专知会员服务
28+阅读 · 2025年11月17日
走向通用虚拟智能体
专知会员服务
76+阅读 · 2023年11月26日
多智能体系统带宽分配及预测云控制
专知会员服务
18+阅读 · 2023年7月9日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
58+阅读 · 2021年3月31日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
15+阅读 · 2020年9月9日
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
自注意力机制在计算机视觉中的应用
GAN生成式对抗网络
19+阅读 · 2018年12月20日
自注意力机制在计算机视觉中的应用【附PPT与视频资料】
人工智能前沿讲习班
17+阅读 · 2018年12月20日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(16份)
专知会员服务
5+阅读 · 4月12日
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
12+阅读 · 4月12日
远程空中优势:新一代超视距导弹的兴起
专知会员服务
2+阅读 · 4月12日
大语言模型溯因推理的统一分类学与综述
专知会员服务
2+阅读 · 4月12日
相关VIP内容
智能体适应
专知会员服务
25+阅读 · 2025年12月11日
《分布式多智能体强化学习策略的可解释性研究》
专知会员服务
28+阅读 · 2025年11月17日
走向通用虚拟智能体
专知会员服务
76+阅读 · 2023年11月26日
多智能体系统带宽分配及预测云控制
专知会员服务
18+阅读 · 2023年7月9日
【CVPR2021】现实世界域泛化的自适应方法
专知会员服务
58+阅读 · 2021年3月31日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员