Vista4D: Video Reshooting with 4D Point Clouds - 专知论文

会员服务 ·

0

视频 · 点云 · 鲁棒 · 一致 · 重建 ·

Vista4D: Video Reshooting with 4D Point Clouds

翻译：Vista4D: 基于4D点云的视频重摄方法

Kuan Heng Lin,Zhizheng Liu,Pablo Salamanca,Yash Kant,Ryan Burgert,Yuancheng Xu,Koichi Namekata,Yiwei Zhao,Bolei Zhou,Micah Goldblum,Paul Debevec,Ning Yu

from arxiv, 24 pages, 20 figures, CVPR 2026, see project page at https://eyeline-labs.github.io/Vista4D

We present Vista4D, a robust and flexible video reshooting framework that grounds the input video and target cameras in a 4D point cloud. Specifically, given an input video, our method re-synthesizes the scene with the same dynamics from a different camera trajectory and viewpoint. Existing video reshooting methods often struggle with depth estimation artifacts of real-world dynamic videos, while also failing to preserve content appearance and failing to maintain precise camera control for challenging new trajectories. We build a 4D-grounded point cloud representation with static pixel segmentation and 4D reconstruction to explicitly preserve seen content and provide rich camera signals, and we train with reconstructed multiview dynamic data for robustness against point cloud artifacts during real-world inference. Our results demonstrate improved 4D consistency, camera control, and visual quality compared to state-of-the-art baselines under a variety of videos and camera paths. Moreover, our method generalizes to real-world applications such as dynamic scene expansion and 4D scene recomposition. See our project page for results, code, and models: https://eyeline-labs.github.io/Vista4D

翻译：我们提出Vista4D，一个鲁棒且灵活的视频重摄框架，该框架将输入视频与目标相机位姿嵌入4D点云进行建模。具体而言，给定输入视频，我们的方法能够从不同的相机轨迹与视角重新合成具有相同动态内容的场景。现有视频重摄方法在处理真实世界动态视频的深度估计伪影时存在困难，同时无法保持内容外观的一致性，且对具有挑战性的新轨迹难以实现精确的相机控制。我们通过静态像素分割与4D重建构建基于4D点云的表征，显式保留已观测内容并提供丰富的相机信号；同时利用重建的多视角动态数据进行训练，以增强对真实世界推理中点云伪影的鲁棒性。实验结果表明，在多种视频与相机路径场景下，我们的方法相比最先进基线方法在4D一致性、相机控制与视觉质量方面均有提升。此外，本方法可泛化至动态场景扩展与4D场景重组等真实应用。结果、代码与模型详见项目页面：https://eyeline-labs.github.io/Vista4D

0

相关内容

视频

【NeurIPS2025】Instant4D：高效的4D高斯喷溅方法

【NeurIPS2025】Instant4D：高效的4D高斯喷溅方法

专知会员服务

7+阅读 · 2025年10月2日

【CVPR2025】FluidNexus: 基于单个视频的三维流体重建与预测

【CVPR2025】FluidNexus: 基于单个视频的三维流体重建与预测

专知会员服务

11+阅读 · 2025年3月7日

【伯克利博士论文】揭示任何视频背后的四维世界

【伯克利博士论文】揭示任何视频背后的四维世界

专知会员服务

26+阅读 · 2024年11月24日

【CMU博士论文】开放环境视频中的多人三维重建，184页pdf

【CMU博士论文】开放环境视频中的多人三维重建，184页pdf

专知会员服务

34+阅读 · 2023年10月11日

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

专知会员服务

39+阅读 · 2022年8月9日

CVPR 2021 Oral | 室内动态场景中的相机重定位

CVPR 2021 Oral | 室内动态场景中的相机重定位

专知会员服务

16+阅读 · 2021年4月12日

基于深度学习的单幅图像超分辨率重建算法综述

专知会员服务

35+阅读 · 2021年2月7日

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

专知会员服务

12+阅读 · 2020年4月6日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

110+阅读 · 2019年12月31日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

三维重建 3D reconstruction 有哪些实用算法？

三维重建 3D reconstruction 有哪些实用算法？

极市平台

13+阅读 · 2020年2月23日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

计算机视觉方向简介 | 三维重建技术概述

计算机视觉方向简介 | 三维重建技术概述

计算机视觉life

26+阅读 · 2019年6月13日

目前最好的开源人脸3D重建与密集对齐算法

目前最好的开源人脸3D重建与密集对齐算法

计算机视觉life

17+阅读 · 2019年4月24日

深度学习在计算机视觉领域（包括图像，视频，3-D点云，深度图）的应用一览

深度学习在计算机视觉领域（包括图像，视频，3-D点云，深度图）的应用一览

极市平台

18+阅读 · 2019年3月21日

新型相机DVS/Event-based camera的发展及应用

新型相机DVS/Event-based camera的发展及应用

计算机视觉life

16+阅读 · 2019年3月12日

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

泡泡机器人SLAM

12+阅读 · 2018年10月2日

【pix4D篇】——Pix4D软件介绍

【pix4D篇】——Pix4D软件介绍

无人机

18+阅读 · 2018年8月1日

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉life

17+阅读 · 2018年5月23日

深度学习之图像超分辨重建技术

深度学习之图像超分辨重建技术

机器学习研究会

12+阅读 · 2018年3月24日

基于车载激光点云的城市道路三维精细重建

国家自然科学基金

0+阅读 · 2015年12月31日

云环境下结合视觉特征的图像视频集编码与传输

国家自然科学基金

1+阅读 · 2015年12月31日

斜模式高光谱成像的超分辨率重建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

多约束协同的彩色夜视影像亚像素超分辨率重建

国家自然科学基金

1+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

融合机载与车载点云的建筑物群快速三维重建方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

FreeOrbit4D: Training-Free Arbitrary Camera Redirection for Monocular Videos via Foreground-Complete 4D Reconstruction

Arxiv

0+阅读 · 5月19日

4RC: 4D Reconstruction via Conditional Querying Anytime and Anywhere

Arxiv

0+阅读 · 5月5日

Unified 4D World Action Modeling from Video Priors with Asynchronous Denoising

Arxiv

0+阅读 · 4月29日

Align then Adapt: Rethinking Parameter-Efficient Transfer Learning in 4D Perception

Arxiv

0+阅读 · 4月28日

VistaBot: View-Robust Robot Manipulation via Spatiotemporal-Aware View Synthesis

Arxiv

0+阅读 · 4月23日

GeoRect4D: Geometry-Compatible Generative Rectification for Dynamic Sparse-View 3D Reconstruction

Arxiv

0+阅读 · 4月22日

Face Anything: 4D Face Reconstruction from Any Image Sequence

Arxiv

0+阅读 · 4月21日

Diff4Splat: Controllable 4D Scene Generation with Latent Dynamic Reconstruction Models

Arxiv

0+阅读 · 4月7日

LaVR: Scene Latent Conditioned Generative Video Trajectory Re-Rendering using Large 4D Reconstruction Models

Arxiv

0+阅读 · 4月2日

ViSTAR: Virtual Skill Training with Augmented Reality with 3D Avatars and LLM coaching agent

Arxiv

0+阅读 · 3月18日

VIP会员

文章信息

相关主题

最新内容

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

4+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

5+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

5+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

5+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

3+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

5+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

5+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

7+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

8+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

12+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

10+阅读 · 7月18日

相关VIP内容

【NeurIPS2025】Instant4D：高效的4D高斯喷溅方法

【NeurIPS2025】Instant4D：高效的4D高斯喷溅方法

专知会员服务

7+阅读 · 2025年10月2日

【CVPR2025】FluidNexus: 基于单个视频的三维流体重建与预测

【CVPR2025】FluidNexus: 基于单个视频的三维流体重建与预测

专知会员服务

11+阅读 · 2025年3月7日

【伯克利博士论文】揭示任何视频背后的四维世界

【伯克利博士论文】揭示任何视频背后的四维世界

专知会员服务

26+阅读 · 2024年11月24日

【CMU博士论文】开放环境视频中的多人三维重建，184页pdf

【CMU博士论文】开放环境视频中的多人三维重建，184页pdf

专知会员服务

34+阅读 · 2023年10月11日

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

专知会员服务

39+阅读 · 2022年8月9日

CVPR 2021 Oral | 室内动态场景中的相机重定位

CVPR 2021 Oral | 室内动态场景中的相机重定位

专知会员服务

16+阅读 · 2021年4月12日

基于深度学习的单幅图像超分辨率重建算法综述

专知会员服务

35+阅读 · 2021年2月7日

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

专知会员服务

12+阅读 · 2020年4月6日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

110+阅读 · 2019年12月31日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

印度精确打击与指挥架构的断层

美空军AI完成F-16战斗机自主空战历史性试飞

相关资讯

三维重建 3D reconstruction 有哪些实用算法？

三维重建 3D reconstruction 有哪些实用算法？

极市平台

13+阅读 · 2020年2月23日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

计算机视觉方向简介 | 三维重建技术概述

计算机视觉方向简介 | 三维重建技术概述

计算机视觉life

26+阅读 · 2019年6月13日

目前最好的开源人脸3D重建与密集对齐算法

目前最好的开源人脸3D重建与密集对齐算法

计算机视觉life

17+阅读 · 2019年4月24日

深度学习在计算机视觉领域（包括图像，视频，3-D点云，深度图）的应用一览

深度学习在计算机视觉领域（包括图像，视频，3-D点云，深度图）的应用一览

极市平台

18+阅读 · 2019年3月21日

新型相机DVS/Event-based camera的发展及应用

新型相机DVS/Event-based camera的发展及应用

计算机视觉life

16+阅读 · 2019年3月12日

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

【泡泡点云时空】3DFeat-Net：用于点云配准的弱监督学习的局部3D特征（ECCV2018-3）

泡泡机器人SLAM

12+阅读 · 2018年10月2日

【pix4D篇】——Pix4D软件介绍

【pix4D篇】——Pix4D软件介绍

无人机

18+阅读 · 2018年8月1日

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉life

17+阅读 · 2018年5月23日

深度学习之图像超分辨重建技术

深度学习之图像超分辨重建技术

机器学习研究会

12+阅读 · 2018年3月24日

相关论文

FreeOrbit4D: Training-Free Arbitrary Camera Redirection for Monocular Videos via Foreground-Complete 4D Reconstruction

Arxiv

0+阅读 · 5月19日

4RC: 4D Reconstruction via Conditional Querying Anytime and Anywhere

Arxiv

0+阅读 · 5月5日

Unified 4D World Action Modeling from Video Priors with Asynchronous Denoising

Arxiv

0+阅读 · 4月29日

Align then Adapt: Rethinking Parameter-Efficient Transfer Learning in 4D Perception

Arxiv

0+阅读 · 4月28日

VistaBot: View-Robust Robot Manipulation via Spatiotemporal-Aware View Synthesis

Arxiv

0+阅读 · 4月23日

GeoRect4D: Geometry-Compatible Generative Rectification for Dynamic Sparse-View 3D Reconstruction

Arxiv

0+阅读 · 4月22日

Face Anything: 4D Face Reconstruction from Any Image Sequence

Arxiv

0+阅读 · 4月21日

Diff4Splat: Controllable 4D Scene Generation with Latent Dynamic Reconstruction Models

Arxiv

0+阅读 · 4月7日

LaVR: Scene Latent Conditioned Generative Video Trajectory Re-Rendering using Large 4D Reconstruction Models

Arxiv

0+阅读 · 4月2日

ViSTAR: Virtual Skill Training with Augmented Reality with 3D Avatars and LLM coaching agent

Arxiv

0+阅读 · 3月18日

相关基金

基于车载激光点云的城市道路三维精细重建

国家自然科学基金

0+阅读 · 2015年12月31日

云环境下结合视觉特征的图像视频集编码与传输

国家自然科学基金

1+阅读 · 2015年12月31日

斜模式高光谱成像的超分辨率重建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

多约束协同的彩色夜视影像亚像素超分辨率重建

国家自然科学基金

1+阅读 · 2015年12月31日

工业过程动态数据的多模型在线重构研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

融合机载与车载点云的建筑物群快速三维重建方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员