点桥：用于跨域策略学习的3D表示 (Point Bridge: 3D Representations for Cross Domain Policy Learning) - 专知论文

会员服务 ·

0

表示 · 合成 · 策略学习 · 合成数据 · 3D ·

Point Bridge: 3D Representations for Cross Domain Policy Learning

翻译：点桥：用于跨域策略学习的3D表示

Siddhant Haldar,Lars Johannsmeier,Lerrel Pinto,Abhishek Gupta,Dieter Fox,Yashraj Narang,Ajay Mandlekar

Robot foundation models are beginning to deliver on the promise of generalist robotic agents, yet progress remains constrained by the scarcity of large-scale real-world manipulation datasets. Simulation and synthetic data generation offer a scalable alternative, but their usefulness is limited by the visual domain gap between simulation and reality. In this work, we present Point Bridge, a framework that leverages unified, domain-agnostic point-based representations to unlock synthetic datasets for zero-shot sim-to-real policy transfer, without explicit visual or object-level alignment. Point Bridge combines automated point-based representation extraction via Vision-Language Models (VLMs), transformer-based policy learning, and efficient inference-time pipelines to train capable real-world manipulation agents using only synthetic data. With additional co-training on small sets of real demonstrations, Point Bridge further improves performance, substantially outperforming prior vision-based sim-and-real co-training methods. It achieves up to 44% gains in zero-shot sim-to-real transfer and up to 66% with limited real data across both single-task and multitask settings. Videos of the robot are best viewed at: https://pointbridge3d.github.io/

翻译：机器人基础模型正在逐步实现通用机器人智能体的愿景，然而进展仍受限于大规模真实世界操作数据集的稀缺性。仿真与合成数据生成提供了可扩展的替代方案，但其有效性受限于仿真与现实之间的视觉域差异。本工作提出点桥框架，该框架利用统一的、领域无关的基于点的表示，无需显式的视觉或对象级对齐，即可实现零样本仿真到现实策略迁移，从而释放合成数据集的潜力。点桥结合了通过视觉语言模型实现的自动化点表示提取、基于Transformer的策略学习以及高效的推理时流水线，仅使用合成数据即可训练出具备真实世界操作能力的智能体。通过在小规模真实演示数据上进行协同训练，点桥进一步提升了性能，显著优于先前基于视觉的仿真与真实数据协同训练方法。在单任务和多任务场景下，该方法在零样本仿真到现实迁移中实现了高达44%的性能提升，在有限真实数据条件下更可达到66%的提升。机器人演示视频请访问：https://pointbridge3d.github.io/

0

相关内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

7+阅读 · 2月9日

3D点云基础模型：综述与展望

3D点云基础模型：综述与展望

专知会员服务

17+阅读 · 2025年1月31日

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

专知会员服务

38+阅读 · 2023年6月22日

复旦等最新《预训练3D点云的自监督学习》综述

复旦等最新《预训练3D点云的自监督学习》综述

专知会员服务

31+阅读 · 2023年5月10日

【剑桥博士论文】利用世界表示中的多模态和结构，144页pdf

【剑桥博士论文】利用世界表示中的多模态和结构，144页pdf

专知会员服务

54+阅读 · 2023年3月30日

【新加破南洋理工】点云的无监督表示学习综述，Unsupervised Representation Learning for Point Clouds: A Survey

【新加破南洋理工】点云的无监督表示学习综述，Unsupervised Representation Learning for Point Clouds: A Survey

专知会员服务

29+阅读 · 2022年3月2日

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

专知会员服务

12+阅读 · 2020年4月6日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

109+阅读 · 2019年12月31日

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

专知会员服务

74+阅读 · 2019年11月20日

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

专知会员服务

35+阅读 · 2019年11月18日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【泡泡图灵智库】解释PointNet：PointNet网络内部到底学习到了什么？

【泡泡图灵智库】解释PointNet：PointNet网络内部到底学习到了什么？

泡泡机器人SLAM

13+阅读 · 2019年10月14日

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

机器之心

11+阅读 · 2019年9月10日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

泡泡机器人SLAM

15+阅读 · 2019年1月21日

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

泡泡机器人SLAM

11+阅读 · 2019年1月20日

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

泡泡机器人SLAM

20+阅读 · 2018年12月27日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究

国家自然科学基金

17+阅读 · 2015年12月31日

复杂环境下面向激光扫描点云的三维目标定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于节点使用概率的通信网络性能研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向智能穿戴设备的三维图形网格简化与渐进显示方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

融合机载与车载点云的建筑物群快速三维重建方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

GRAIL: Goal Recognition Alignment through Imitation Learning

Arxiv

0+阅读 · 2月15日

StackingNet: Collective Inference Across Independent AI Foundation Models

Arxiv

0+阅读 · 2月14日

Learning to Compose for Cross-domain Agentic Workflow Generation

Arxiv

0+阅读 · 2月11日

EquiForm: Noise-Robust SE(3)-Equivariant Policy Learning from 3D Point Clouds

Arxiv

0+阅读 · 1月24日

Point Bridge: 3D Representations for Cross Domain Policy Learning

Arxiv

0+阅读 · 1月24日

AnyTask: an Automated Task and Data Generation Framework for Advancing Sim-to-Real Policy Learning

Arxiv

0+阅读 · 1月20日

Curriculum-Based Strategies for Efficient Cross-Domain Action Recognition

Arxiv

0+阅读 · 1月20日

Generalizable Domain Adaptation for Sim-and-Real Policy Co-Training

Arxiv

0+阅读 · 1月16日

SceneFoundry: Generating Interactive Infinite 3D Worlds

Arxiv

0+阅读 · 1月16日

CEI: A Unified Interface for Cross-Embodiment Visuomotor Policy Learning in 3D Space

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

相关VIP内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

7+阅读 · 2月9日

3D点云基础模型：综述与展望

3D点云基础模型：综述与展望

专知会员服务

17+阅读 · 2025年1月31日

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

专知会员服务

38+阅读 · 2023年6月22日

复旦等最新《预训练3D点云的自监督学习》综述

复旦等最新《预训练3D点云的自监督学习》综述

专知会员服务

31+阅读 · 2023年5月10日

【剑桥博士论文】利用世界表示中的多模态和结构，144页pdf

【剑桥博士论文】利用世界表示中的多模态和结构，144页pdf

专知会员服务

54+阅读 · 2023年3月30日

【新加破南洋理工】点云的无监督表示学习综述，Unsupervised Representation Learning for Point Clouds: A Survey

【新加破南洋理工】点云的无监督表示学习综述，Unsupervised Representation Learning for Point Clouds: A Survey

专知会员服务

29+阅读 · 2022年3月2日

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

专知会员服务

12+阅读 · 2020年4月6日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

109+阅读 · 2019年12月31日

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

【WSDN 2020 论文】一种结构图表示学习框架（A Structural Graph Representation Learning Framework）

专知会员服务

74+阅读 · 2019年11月20日

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

专知会员服务

35+阅读 · 2019年11月18日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【泡泡图灵智库】解释PointNet：PointNet网络内部到底学习到了什么？

【泡泡图灵智库】解释PointNet：PointNet网络内部到底学习到了什么？

泡泡机器人SLAM

13+阅读 · 2019年10月14日

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

机器之心

11+阅读 · 2019年9月10日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

【泡泡图灵智库】SGPN：用于3D点云实例分割的相似群建议网络（CVPR）

泡泡机器人SLAM

15+阅读 · 2019年1月21日

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

泡泡机器人SLAM

11+阅读 · 2019年1月20日

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

泡泡机器人SLAM

20+阅读 · 2018年12月27日

相关论文

GRAIL: Goal Recognition Alignment through Imitation Learning

Arxiv

0+阅读 · 2月15日

StackingNet: Collective Inference Across Independent AI Foundation Models

Arxiv

0+阅读 · 2月14日

Learning to Compose for Cross-domain Agentic Workflow Generation

Arxiv

0+阅读 · 2月11日

EquiForm: Noise-Robust SE(3)-Equivariant Policy Learning from 3D Point Clouds

Arxiv

0+阅读 · 1月24日

Point Bridge: 3D Representations for Cross Domain Policy Learning

Arxiv

0+阅读 · 1月24日

AnyTask: an Automated Task and Data Generation Framework for Advancing Sim-to-Real Policy Learning

Arxiv

0+阅读 · 1月20日

Curriculum-Based Strategies for Efficient Cross-Domain Action Recognition

Arxiv

0+阅读 · 1月20日

Generalizable Domain Adaptation for Sim-and-Real Policy Co-Training

Arxiv

0+阅读 · 1月16日

SceneFoundry: Generating Interactive Infinite 3D Worlds

Arxiv

0+阅读 · 1月16日

CEI: A Unified Interface for Cross-Embodiment Visuomotor Policy Learning in 3D Space

Arxiv

0+阅读 · 1月14日

相关基金

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究

国家自然科学基金

17+阅读 · 2015年12月31日

复杂环境下面向激光扫描点云的三维目标定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于节点使用概率的通信网络性能研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向智能穿戴设备的三维图形网格简化与渐进显示方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

融合机载与车载点云的建筑物群快速三维重建方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员