Point-MF: One-step Point Cloud Generation from a Single Image via Mean Flows - 专知论文

会员服务 ·

0

均值 · 点云 · 重建 · 去噪 · 点云重建 ·

Point-MF: One-step Point Cloud Generation from a Single Image via Mean Flows

翻译：Point-MF：基于均值流的一步式单图像点云生成

Yuta Baba,Keiji Yanai

from arxiv, 28 pages, 14 figures

Single-image point cloud reconstruction must infer complete 3D geometry, including occluded parts, from a single RGB image. While diffusion-based reconstructors achieve high accuracy, they typically require many denoising iterations, resulting in slow and expensive inference. We propose Point-MF, a Mean-Flow-based framework for low-NFE single-image point cloud reconstruction that couples a Mean-Flow-compatible architecture with an auxiliary loss. Specifically, Point-MF operates directly in point-cloud space to learn the mean velocity field and enables one-step reconstruction with a single network function evaluation (1-NFE), without relying on VAE-based latent representations. To make Mean Flow effective under large interval jumps, Point-MF employs a Diffusion Transformer tailored to the Mean-Flow setting, conditioned on frozen DINOv3 image features via a lightweight token adapter and equipped with explicit interval/time conditioning. Moreover, we introduce Denoised Space Anchor, a set-distance auxiliary loss on the denoised-space estimate $x_θ$ induced by the predicted velocity field, to stabilize large-step generation and reduce outliers and density artifacts. On ShapeNet-R2N2 and Pix3D, Point-MF strikes a strong balance between reconstruction quality and inference speed compared to multi-step diffusion baselines and competitive feedforward models, while generating high-quality point clouds with millisecond-level latency.

翻译：单图像点云重建需从单张RGB图像中推断完整的3D几何结构（包括被遮挡部分）。尽管基于扩散的重建方法精度较高，但通常需要大量去噪迭代，导致推理过程缓慢且计算成本高昂。我们提出Point-MF——一种基于均值流的低NFE单图像点云重建框架，该框架将兼容均值流的架构与辅助损失函数相结合。具体而言，Point-MF直接在点云空间中学习均值速度场，无需依赖基于变分自编码器的潜在表示，即可通过单次网络函数评估实现一步式重建。为使均值流在大间隔跳跃下保持有效性，Point-MF采用针对均值流场景定制的扩散Transformer，通过轻量级令牌适配器以冻结的DINOv3图像特征为条件，并配备显式间隔/时间条件。此外，我们提出“去噪空间锚点”——一种针对预测速度场诱导的去噪空间估计$x_θ$的集合距离辅助损失函数，用于稳定大步长生成并减少离群点与密度伪影。在ShapeNet-R2N2与Pix3D数据集上，Point-MF在多步扩散基线模型及竞争性前馈模型之间实现了重建质量与推理速度的强平衡，同时生成毫秒级延迟的高质量点云。

0

相关内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

9+阅读 · 2月9日

3D点云基础模型：综述与展望

3D点云基础模型：综述与展望

专知会员服务

17+阅读 · 2025年1月31日

【TPAMI2023】GeoTransformer: 使用几何变换器进行快速且稳健的点云配准

【TPAMI2023】GeoTransformer: 使用几何变换器进行快速且稳健的点云配准

专知会员服务

27+阅读 · 2023年8月12日

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

专知会员服务

38+阅读 · 2023年6月22日

三维点云配准方法研究进展

专知会员服务

34+阅读 · 2021年7月25日

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

专知会员服务

12+阅读 · 2020年4月6日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

专知会员服务

71+阅读 · 2020年1月22日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

109+阅读 · 2019年12月31日

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

专知会员服务

35+阅读 · 2019年11月18日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

泡泡机器人SLAM

23+阅读 · 2019年6月12日

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

泡泡机器人SLAM

29+阅读 · 2019年5月29日

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

泡泡机器人SLAM

41+阅读 · 2019年5月19日

CVPR 2019 | PointConv：在点云上高效实现卷积操作

CVPR 2019 | PointConv：在点云上高效实现卷积操作

机器之心

10+阅读 · 2019年4月21日

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

泡泡机器人SLAM

13+阅读 · 2018年10月7日

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

泡泡机器人SLAM

12+阅读 · 2018年10月2日

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

泡泡机器人SLAM

12+阅读 · 2018年9月18日

基于几何特征的激光雷达地面点云分割

基于几何特征的激光雷达地面点云分割

泡泡机器人SLAM

15+阅读 · 2018年4月1日

顾及扫描上下文的预测与判决相结合的点云在线分类方法

国家自然科学基金

0+阅读 · 2015年12月31日

点云变形序列特征提取及可监测性评价研究

国家自然科学基金

1+阅读 · 2015年12月31日

航空叶片多光学传感器多尺度测量点云高效拼合方法

国家自然科学基金

0+阅读 · 2015年12月31日

重离子点扫描中基于笔形束低剂量包络的非均一束斑变间距排布方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

激光点云数据处理中基于贝叶斯抽样一致性的模型参数稳健估计方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

融合机载与车载点云的建筑物群快速三维重建方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Leveraging Previous-Traversal Point Cloud Map Priors for Camera-Based 3D Object Detection and Tracking

Arxiv

0+阅读 · 4月28日

PC2Model: ISPRS benchmark on 3D point cloud to model registration

Arxiv

0+阅读 · 4月23日

IR-Flow: Bridging Discriminative and Generative Image Restoration via Rectified Flow

Arxiv

0+阅读 · 4月21日

PixelDiT: Pixel Diffusion Transformers for Image Generation

Arxiv

0+阅读 · 4月16日

Topo-ADV: Generating Topology-Driven Imperceptible Adversarial Point Clouds

Arxiv

0+阅读 · 4月10日

PointTPA: Dynamic Network Parameter Adaptation for 3D Scene Understanding

Arxiv

0+阅读 · 4月6日

Fast Large-Scale Model-Based Iterative Tomography via Exploiting Mathematical Structure, Hierarchical Optimization, Smart Initialization, and Distributed GPU Computing

Arxiv

0+阅读 · 3月30日

TreeON: Reconstructing 3D Tree Point Clouds from Orthophotos and Heightmaps

Arxiv

0+阅读 · 3月11日

GeoDiT: Point-Conditioned Diffusion Transformer for Satellite Image Synthesis

Arxiv

0+阅读 · 3月2日

MeanVoiceFlow: One-step Nonparallel Voice Conversion with Mean Flows

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

《不确定性环境下基于智能体框架中实时多机器人任务分配的贝叶斯网络》博士论文

《不确定性环境下基于智能体框架中实时多机器人任务分配的贝叶斯网络》博士论文

专知会员服务

0+阅读 · 6分钟前

首场人工智能战争——俄乌战争（中文版、原文下载）

首场人工智能战争——俄乌战争（中文版、原文下载）

专知会员服务

0+阅读 · 今天1:52

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

专知会员服务

2+阅读 · 今天1:36

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

专知会员服务

1+阅读 · 今天1:28

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

专知会员服务

1+阅读 · 今天1:16

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

专知会员服务

2+阅读 · 5月8日

生成-过滤-控制-重放：LLM强化学习中Rollout策略的全面综述

生成-过滤-控制-重放：LLM强化学习中Rollout策略的全面综述

专知会员服务

0+阅读 · 5月8日

认知战与交战性质的改变：神经战略视角

认知战与交战性质的改变：神经战略视角

专知会员服务

5+阅读 · 5月8日

美国《国防授权法案》指令要求界定“认知战”：区分相关概念

美国《国防授权法案》指令要求界定“认知战”：区分相关概念

专知会员服务

4+阅读 · 5月8日

人工智能对特定国防资源管理流程的影响（万字长文）

人工智能对特定国防资源管理流程的影响（万字长文）

专知会员服务

5+阅读 · 5月8日

《多域作战概念实证检验：美军“史诗怒火”行动中跨域协同的地理空间混合方法分析研究》245页报告

《多域作战概念实证检验：美军“史诗怒火”行动中跨域协同的地理空间混合方法分析研究》245页报告

专知会员服务

8+阅读 · 5月8日

《预设时间的单次协同估计、制导与控制框架：实现同时目标拦截》2026最新40页报告

《预设时间的单次协同估计、制导与控制框架：实现同时目标拦截》2026最新40页报告

专知会员服务

10+阅读 · 5月8日

《美空军条令出版物：网络空间作战（2026版）》

《美空军条令出版物：网络空间作战（2026版）》

专知会员服务

11+阅读 · 5月8日

《美空军条令出版物：空军作战中的信息（2026版）》

《美空军条令出版物：空军作战中的信息（2026版）》

专知会员服务

13+阅读 · 5月8日

为指挥控制与防御构建智能网络结构：集成感知与通信以提升频谱利用率

为指挥控制与防御构建智能网络结构：集成感知与通信以提升频谱利用率

专知会员服务

9+阅读 · 5月8日

相关VIP内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

9+阅读 · 2月9日

3D点云基础模型：综述与展望

3D点云基础模型：综述与展望

专知会员服务

17+阅读 · 2025年1月31日

【TPAMI2023】GeoTransformer: 使用几何变换器进行快速且稳健的点云配准

【TPAMI2023】GeoTransformer: 使用几何变换器进行快速且稳健的点云配准

专知会员服务

27+阅读 · 2023年8月12日

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

专知会员服务

38+阅读 · 2023年6月22日

三维点云配准方法研究进展

专知会员服务

34+阅读 · 2021年7月25日

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

专知会员服务

12+阅读 · 2020年4月6日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

专知会员服务

71+阅读 · 2020年1月22日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

109+阅读 · 2019年12月31日

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

【ACM Multimedia 2019 Tutorial】学习3D(点云)数据（Learning from 3D (Point Cloud) Data）,国立台湾大学计算机科学与资讯工程学系的教授徐宏民

专知会员服务

35+阅读 · 2019年11月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

相关资讯

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

【泡泡点云时空】PointConv: 3D点云的深度卷积网络

泡泡机器人SLAM

23+阅读 · 2019年6月12日

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

【泡泡点云时空】DeepMapping: 来自多重点云的无监督地图估计

泡泡机器人SLAM

29+阅读 · 2019年5月29日

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

【泡泡点云时空】FlowNet3D：学习三维点云中的场景流

泡泡机器人SLAM

41+阅读 · 2019年5月19日

CVPR 2019 | PointConv：在点云上高效实现卷积操作

CVPR 2019 | PointConv：在点云上高效实现卷积操作

机器之心

10+阅读 · 2019年4月21日

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

【泡泡点云时空】基于增量分割的3D点云定位方法（ICRA2018-4）

泡泡机器人SLAM

13+阅读 · 2018年10月7日

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

泡泡机器人SLAM

12+阅读 · 2018年10月2日

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

泡泡机器人SLAM

12+阅读 · 2018年9月18日

基于几何特征的激光雷达地面点云分割

基于几何特征的激光雷达地面点云分割

泡泡机器人SLAM

15+阅读 · 2018年4月1日

相关论文

Leveraging Previous-Traversal Point Cloud Map Priors for Camera-Based 3D Object Detection and Tracking

Arxiv

0+阅读 · 4月28日

PC2Model: ISPRS benchmark on 3D point cloud to model registration

Arxiv

0+阅读 · 4月23日

IR-Flow: Bridging Discriminative and Generative Image Restoration via Rectified Flow

Arxiv

0+阅读 · 4月21日

PixelDiT: Pixel Diffusion Transformers for Image Generation

Arxiv

0+阅读 · 4月16日

Topo-ADV: Generating Topology-Driven Imperceptible Adversarial Point Clouds

Arxiv

0+阅读 · 4月10日

PointTPA: Dynamic Network Parameter Adaptation for 3D Scene Understanding

Arxiv

0+阅读 · 4月6日

Fast Large-Scale Model-Based Iterative Tomography via Exploiting Mathematical Structure, Hierarchical Optimization, Smart Initialization, and Distributed GPU Computing

Arxiv

0+阅读 · 3月30日

TreeON: Reconstructing 3D Tree Point Clouds from Orthophotos and Heightmaps

Arxiv

0+阅读 · 3月11日

GeoDiT: Point-Conditioned Diffusion Transformer for Satellite Image Synthesis

Arxiv

0+阅读 · 3月2日

MeanVoiceFlow: One-step Nonparallel Voice Conversion with Mean Flows

Arxiv

0+阅读 · 2月20日

相关基金

顾及扫描上下文的预测与判决相结合的点云在线分类方法

国家自然科学基金

0+阅读 · 2015年12月31日

点云变形序列特征提取及可监测性评价研究

国家自然科学基金

1+阅读 · 2015年12月31日

航空叶片多光学传感器多尺度测量点云高效拼合方法

国家自然科学基金

0+阅读 · 2015年12月31日

重离子点扫描中基于笔形束低剂量包络的非均一束斑变间距排布方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

激光点云数据处理中基于贝叶斯抽样一致性的模型参数稳健估计方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

融合机载与车载点云的建筑物群快速三维重建方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员