Depth sensors are widely deployed across robotic platforms, and advances in fast, high-fidelity depth simulation have enabled robotic policies trained on depth observations to achieve robust sim-to-real transfer for a wide range of tasks. Despite this, representation learning for depth modality remains underexplored compared to RGB, where large-scale foundation models now define the state of the art. To address this gap, we present DeFM, a self-supervised foundation model trained entirely on depth images for robotic applications. Using a DINO-style self-distillation objective on a curated dataset of 60M depth images, DeFM learns geometric and semantic representations that generalize to diverse environments, tasks, and sensors. To retain metric awareness across multiple scales, we introduce a novel input normalization strategy. We further distill DeFM into compact models suitable for resource-constrained robotic systems. When evaluated on depth-based classification, segmentation, navigation, locomotion, and manipulation benchmarks, DeFM achieves state-of-the-art performance and demonstrates strong generalization from simulation to real-world environments. We release all our pretrained models, which can be adopted off-the-shelf for depth-based robotic learning without task-specific fine-tuning. Webpage: https://de-fm.github.io/


翻译:深度传感器已在各类机器人平台上广泛应用,快速高保真深度模拟技术的进步使得基于深度观测训练的机器人策略能够在广泛任务中实现鲁棒的仿真到现实迁移。尽管如此,与已由大规模基础模型定义技术前沿的RGB模态相比,深度模态的表征学习仍处于探索不足的状态。为填补这一空白,我们提出DeFM——一个完全基于深度图像训练的自监督基础模型,专为机器人应用设计。通过在6000万张深度图像组成的精选数据集上采用DINO风格的自蒸馏目标,DeFM能够学习可泛化至不同环境、任务和传感器的几何与语义表征。为在多尺度下保持度量感知能力,我们提出了一种新颖的输入归一化策略。我们进一步将DeFM蒸馏为适用于资源受限机器人系统的紧凑模型。在基于深度信息的分类、分割、导航、运动与操作基准测试中,DeFM均取得最先进的性能,并展现出从仿真环境到现实场景的强泛化能力。我们开源所有预训练模型,这些模型可直接用于基于深度信息的机器人学习而无需任务特定微调。项目主页:https://de-fm.github.io/

0
下载
关闭预览

相关内容

【NUS博士论文】深度表示学习的视频基础模型,236页pdf
专知会员服务
33+阅读 · 2023年12月26日
【干货书】基于深度学习的机器人感知与认知,638页pdf
专知会员服务
113+阅读 · 2022年7月29日
结合进化算法的深度强化学习方法研究综述
专知会员服务
81+阅读 · 2022年7月16日
机器学习的可解释性
专知会员服务
69+阅读 · 2020年12月18日
深度强化学习简介
专知
30+阅读 · 2018年12月3日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
【深度学习】深度学习的核心:掌握训练数据的方法
产业智能官
12+阅读 · 2018年1月14日
尽早跑通深度学习的实践代码,是入门深度学习的最快途径
算法与数据结构
22+阅读 · 2017年12月13日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员