The adoption of fisheye cameras in robotic manipulation, driven by their exceptionally wide Field of View (FoV), is rapidly outpacing a systematic understanding of their downstream effects on policy learning. This paper presents the first comprehensive empirical study to bridge this gap, rigorously analyzing the properties of wrist-mounted fisheye cameras for imitation learning. Through extensive experiments in both simulation and the real world, we investigate three critical research questions: spatial localization, scene generalization, and hardware generalization. Our investigation reveals that: (1) The wide FoV significantly enhances spatial localization, but this benefit is critically contingent on the visual complexity of the environment. (2) Fisheye-trained policies, while prone to overfitting in simple scenes, unlock superior scene generalization when trained with sufficient environmental diversity. (3) While naive cross-camera transfer leads to failures, we identify the root cause as scale overfitting and demonstrate that hardware generalization performance can be improved with a simple Random Scale Augmentation (RSA) strategy. Collectively, our findings provide concrete, actionable guidance for the large-scale collection and effective use of fisheye datasets in robotic learning. More results and videos are available on https://robo-fisheye.github.io/


翻译:在机器人操作领域,鱼眼相机因其超宽视场而得到广泛采用,但其对策略学习下游影响的系统性理解却远远滞后。本文首次通过全面的实证研究来弥合这一差距,严谨分析了腕戴式鱼眼相机在模仿学习中的特性。通过在仿真和现实世界中的大量实验,我们探究了三个关键研究问题:空间定位、场景泛化与硬件泛化。研究发现:(1)宽视场显著提升了空间定位能力,但该优势高度依赖于环境的视觉复杂度。(2)鱼眼相机训练的策略虽然在简单场景中容易过拟合,但在获得足够环境多样性的训练后,能实现更优的场景泛化。(3)虽然简单的跨相机迁移会导致失败,但我们发现其根本原因在于尺度过拟合,并证明通过简单的随机尺度增强策略可提升硬件泛化性能。综合而言,我们的研究结果为机器人学习中鱼眼数据集的大规模采集与有效使用提供了具体可行的指导。更多结果与视频请访问 https://robo-fisheye.github.io/

0
下载
关闭预览

相关内容

【UIUC博士论文】《从视频中进行机器人学习》
专知会员服务
25+阅读 · 2024年12月20日
代码解读 | VINS_Mono中的鱼眼相机模型
计算机视觉life
16+阅读 · 2019年9月10日
新型相机DVS/Event-based camera的发展及应用
计算机视觉life
16+阅读 · 2019年3月12日
【机器视觉】机器视觉全面解析
产业智能官
12+阅读 · 2018年11月12日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
深度相机原理揭秘--双目立体视觉
计算机视觉life
10+阅读 · 2017年11月7日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
VIP会员
最新内容
国外反无人机系统与技术动态
专知会员服务
1+阅读 · 今天12:48
大规模作战行动中的战术作战评估(研究论文)
专知会员服务
2+阅读 · 今天12:21
未来的海战无人自主系统
专知会员服务
1+阅读 · 今天12:05
美军多域作战现状分析:战略、概念还是幻想?
专知会员服务
2+阅读 · 今天11:52
无人机与反无人机系统(书籍)
专知会员服务
14+阅读 · 今天6:45
美陆军2026条令:安全与机动支援
专知会员服务
5+阅读 · 今天5:49
技术、多域威慑与海上战争(报告)
专知会员服务
8+阅读 · 4月13日
相关VIP内容
【UIUC博士论文】《从视频中进行机器人学习》
专知会员服务
25+阅读 · 2024年12月20日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员