PointMapPolicy: Structured Point Cloud Processing for Multi-Modal Imitation Learning - 专知论文

会员服务 ·

0

模态 · 结构 · 点云 · 多模 · 结构化 ·

PointMapPolicy: Structured Point Cloud Processing for Multi-Modal Imitation Learning

翻译：PointMapPolicy：面向多模态模仿学习的结构化点云处理方法

Xiaogang Jia,Qian Wang,Anrui Wang,Han A. Wang,Balázs Gyenes,Emiliyan Gospodinov,Xinkai Jiang,Ge Li,Hongyi Zhou,Weiran Liao,Xi Huang,Maximilian Beck,Moritz Reuss,Rudolf Lioutikov,Gerhard Neumann

Robotic manipulation systems benefit from complementary sensing modalities, where each provides unique environmental information. Point clouds capture detailed geometric structure, while RGB images provide rich semantic context. Current point cloud methods struggle to capture fine-grained detail, especially for complex tasks, which RGB methods lack geometric awareness, which hinders their precision and generalization. We introduce PointMapPolicy, a novel approach that conditions diffusion policies on structured grids of points without downsampling. The resulting data type makes it easier to extract shape and spatial relationships from observations, and can be transformed between reference frames. Yet due to their structure in a regular grid, we enable the use of established computer vision techniques directly to 3D data. Using xLSTM as a backbone, our model efficiently fuses the point maps with RGB data for enhanced multi-modal perception. Through extensive experiments on the RoboCasa and CALVIN benchmarks and real robot evaluations, we demonstrate that our method achieves state-of-the-art performance across diverse manipulation tasks. The overview and demos are available on our project page: https://point-map.github.io/Point-Map/

翻译：机器人操作系统得益于互补的感知模态，其中每种模态都能提供独特的环境信息。点云捕捉精细的几何结构，而RGB图像则提供丰富的语义上下文。当前点云方法难以捕捉细粒度细节（尤其在复杂任务中），而RGB方法则缺乏几何感知能力，这限制了其精度与泛化性能。本文提出PointMapPolicy，一种基于结构化点网格（无需下采样）的扩散策略新方法。所生成的数据类型便于从观测中提取形状与空间关系，并可在参考坐标系间进行变换。得益于其在规则网格中的结构特性，我们能够将成熟的计算机视觉技术直接应用于三维数据。以xLSTM为骨干网络，我们的模型能高效融合点云图与RGB数据以增强多模态感知能力。通过在RoboCasa与CALVIN基准测试中的大量实验及真实机器人验证，我们证明该方法在多样化操作任务中均达到最先进的性能水平。项目概览与演示视频详见项目页面：https://point-map.github.io/Point-Map/

0

相关内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

9+阅读 · 2月9日

3D点云基础模型：综述与展望

3D点云基础模型：综述与展望

专知会员服务

17+阅读 · 2025年1月31日

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

专知会员服务

38+阅读 · 2023年6月22日

复旦等最新《预训练3D点云的自监督学习》综述

复旦等最新《预训练3D点云的自监督学习》综述

专知会员服务

31+阅读 · 2023年5月10日

「深度学习3D点云处理」最新2022进展综述

「深度学习3D点云处理」最新2022进展综述

专知会员服务

60+阅读 · 2022年9月4日

【新加破南洋理工】点云的无监督表示学习综述，Unsupervised Representation Learning for Point Clouds: A Survey

【新加破南洋理工】点云的无监督表示学习综述，Unsupervised Representation Learning for Point Clouds: A Survey

专知会员服务

29+阅读 · 2022年3月2日

【UIUC】最新《深度学习3D点云理解》综述论文，20页pdf

专知会员服务

30+阅读 · 2020年9月21日

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

专知会员服务

71+阅读 · 2020年1月22日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

110+阅读 · 2019年12月31日

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

专知会员服务

35+阅读 · 2019年11月18日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

泡泡机器人SLAM

23+阅读 · 2019年6月12日

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

泡泡机器人SLAM

29+阅读 · 2019年5月29日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

CVPR 2019 | PointConv：在点云上高效实现卷积操作

CVPR 2019 | PointConv：在点云上高效实现卷积操作

机器之心

10+阅读 · 2019年4月21日

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

泡泡机器人SLAM

11+阅读 · 2019年1月20日

【泡泡点云时空】FoldingNet：通过深度栅格变形的点云自编码器（CVPR2018-2）

【泡泡点云时空】FoldingNet：通过深度栅格变形的点云自编码器（CVPR2018-2）

泡泡机器人SLAM

10+阅读 · 2018年8月7日

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

泡泡机器人SLAM

33+阅读 · 2018年8月6日

基于几何特征的激光雷达地面点云分割

基于几何特征的激光雷达地面点云分割

泡泡机器人SLAM

15+阅读 · 2018年4月1日

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

顾及扫描上下文的预测与判决相结合的点云在线分类方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

点云变形序列特征提取及可监测性评价研究

国家自然科学基金

1+阅读 · 2015年12月31日

云环境下结合视觉特征的图像视频集编码与传输

国家自然科学基金

1+阅读 · 2015年12月31日

复杂环境下面向激光扫描点云的三维目标定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

航空叶片多光学传感器多尺度测量点云高效拼合方法

国家自然科学基金

0+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

复杂曲面结构的激光雷达扫描点云数据处理方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合机载与车载点云的建筑物群快速三维重建方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Geometry-Aware Physics-Informed PointNets for Modeling Flows Across Porous Structures

Arxiv

0+阅读 · 2月15日

End-to-End LiDAR optimization for 3D point cloud registration

Arxiv

0+阅读 · 2月11日

PIRATR: Parametric Object Inference for Robotic Applications with Transformers in 3D Point Clouds

Arxiv

0+阅读 · 2月5日

Physics-Driven Local-Whole Elastic Deformation Modeling for Point Cloud Representation Learning

Arxiv

0+阅读 · 2月5日

MSCloudCAM: Multi-Scale Context Adaptation with Convolutional Cross-Attention for Multispectral Cloud Segmentation

Arxiv

0+阅读 · 1月27日

MGPC: Multimodal Network for Generalizable Point Cloud Completion With Modality Dropout and Progressive Decoding

Arxiv

0+阅读 · 1月27日

EquiForm: Noise-Robust SE(3)-Equivariant Policy Learning from 3D Point Clouds

Arxiv

0+阅读 · 1月24日

Point Bridge: 3D Representations for Cross Domain Policy Learning

Arxiv

0+阅读 · 1月24日

Point Bridge: 3D Representations for Cross Domain Policy Learning

Arxiv

0+阅读 · 1月22日

Graph Smoothing for Enhanced Local Geometry Learning in Point Cloud Analysis

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

9+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

9+阅读 · 2月9日

3D点云基础模型：综述与展望

3D点云基础模型：综述与展望

专知会员服务

17+阅读 · 2025年1月31日

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

专知会员服务

38+阅读 · 2023年6月22日

复旦等最新《预训练3D点云的自监督学习》综述

复旦等最新《预训练3D点云的自监督学习》综述

专知会员服务

31+阅读 · 2023年5月10日

「深度学习3D点云处理」最新2022进展综述

「深度学习3D点云处理」最新2022进展综述

专知会员服务

60+阅读 · 2022年9月4日

【新加破南洋理工】点云的无监督表示学习综述，Unsupervised Representation Learning for Point Clouds: A Survey

【新加破南洋理工】点云的无监督表示学习综述，Unsupervised Representation Learning for Point Clouds: A Survey

专知会员服务

29+阅读 · 2022年3月2日

【UIUC】最新《深度学习3D点云理解》综述论文，20页pdf

专知会员服务

30+阅读 · 2020年9月21日

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

专知会员服务

71+阅读 · 2020年1月22日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

110+阅读 · 2019年12月31日

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

专知会员服务

35+阅读 · 2019年11月18日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

泡泡机器人SLAM

23+阅读 · 2019年6月12日

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

泡泡机器人SLAM

29+阅读 · 2019年5月29日

PointNet系列论文解读

PointNet系列论文解读

人工智能前沿讲习班

17+阅读 · 2019年5月3日

CVPR 2019 | PointConv：在点云上高效实现卷积操作

CVPR 2019 | PointConv：在点云上高效实现卷积操作

机器之心

10+阅读 · 2019年4月21日

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

泡泡机器人SLAM

11+阅读 · 2019年1月20日

【泡泡点云时空】FoldingNet：通过深度栅格变形的点云自编码器（CVPR2018-2）

【泡泡点云时空】FoldingNet：通过深度栅格变形的点云自编码器（CVPR2018-2）

泡泡机器人SLAM

10+阅读 · 2018年8月7日

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

【泡泡点云时空】用于点云识别的注意力形状上下文网络（CVPR2018-1）

泡泡机器人SLAM

33+阅读 · 2018年8月6日

基于几何特征的激光雷达地面点云分割

基于几何特征的激光雷达地面点云分割

泡泡机器人SLAM

15+阅读 · 2018年4月1日

相关论文

Geometry-Aware Physics-Informed PointNets for Modeling Flows Across Porous Structures

Arxiv

0+阅读 · 2月15日

End-to-End LiDAR optimization for 3D point cloud registration

Arxiv

0+阅读 · 2月11日

PIRATR: Parametric Object Inference for Robotic Applications with Transformers in 3D Point Clouds

Arxiv

0+阅读 · 2月5日

Physics-Driven Local-Whole Elastic Deformation Modeling for Point Cloud Representation Learning

Arxiv

0+阅读 · 2月5日

MSCloudCAM: Multi-Scale Context Adaptation with Convolutional Cross-Attention for Multispectral Cloud Segmentation

Arxiv

0+阅读 · 1月27日

MGPC: Multimodal Network for Generalizable Point Cloud Completion With Modality Dropout and Progressive Decoding

Arxiv

0+阅读 · 1月27日

EquiForm: Noise-Robust SE(3)-Equivariant Policy Learning from 3D Point Clouds

Arxiv

0+阅读 · 1月24日

Point Bridge: 3D Representations for Cross Domain Policy Learning

Arxiv

0+阅读 · 1月24日

Point Bridge: 3D Representations for Cross Domain Policy Learning

Arxiv

0+阅读 · 1月22日

Graph Smoothing for Enhanced Local Geometry Learning in Point Cloud Analysis

Arxiv

0+阅读 · 1月16日

相关基金

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

顾及扫描上下文的预测与判决相结合的点云在线分类方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

点云变形序列特征提取及可监测性评价研究

国家自然科学基金

1+阅读 · 2015年12月31日

云环境下结合视觉特征的图像视频集编码与传输

国家自然科学基金

1+阅读 · 2015年12月31日

复杂环境下面向激光扫描点云的三维目标定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

航空叶片多光学传感器多尺度测量点云高效拼合方法

国家自然科学基金

0+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

复杂曲面结构的激光雷达扫描点云数据处理方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合机载与车载点云的建筑物群快速三维重建方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员