StereoSpace: Depth-Free Synthesis of Stereo Geometry via End-to-End Diffusion in a Canonical Space - 专知论文

会员服务 ·

0

端到端 · 合成 · PAC学习理论 · 操作 · 生成器 ·

StereoSpace: Depth-Free Synthesis of Stereo Geometry via End-to-End Diffusion in a Canonical Space

翻译：标题：StereoSpace：基于规范空间端到端扩散的无深度立体几何合成

Tjark Behrens,Anton Obukhov,Bingxin Ke,Fabio Tosi,Matteo Poggi,Konrad Schindler

from arxiv, CVPR 2026 Findings. Project page: https://hf.co/spaces/prs-eth/stereospace

We introduce StereoSpace, a diffusion-based framework for monocular-to-stereo synthesis that models geometry purely through viewpoint conditioning, without explicit depth or warping. A canonical rectified space and the conditioning guide the generator to infer correspondences and fill disocclusions end-to-end. To ensure fair and leakage-free evaluation, we introduce an end-to-end protocol that excludes any ground truth or proxy geometry estimates at test time. The protocol emphasizes metrics reflecting downstream relevance: iSQoE for perceptual comfort and MEt3R for geometric consistency. StereoSpace surpasses other methods from the warp & inpaint, latent-warping, and warped-conditioning categories, achieving sharp parallax and strong robustness on layered and non-Lambertian scenes. This establishes viewpoint-conditioned diffusion as a scalable, depth-free solution for stereo generation.

翻译：摘要：我们提出StereoSpace，一种基于扩散模型的单目到立体合成框架，该框架纯粹通过视点条件建模几何，无需显式深度或扭曲操作。规范校正空间与条件引导生成器端到端地推断对应关系并填充遮挡区域。为确保评估的公平性与无信息泄漏，我们引入了一种端到端评估协议，该协议在测试时排除任何真实数据或代理几何估计。该协议强调反映下游应用相关性的指标：用于感知舒适度的iSQoE和用于几何一致性的MEt3R。StereoSpace超越了扭曲与修复、潜在扭曲以及扭曲条件类别的其他方法，在分层和非朗伯场景下实现了锐利的视差和强大的鲁棒性。这确立了视点条件扩散作为可扩展、无深度解决方案在立体生成领域的地位。

0

相关内容

端到端

【NeurIPS2025】一种基于结构信息原理的离线分层扩散框架

【NeurIPS2025】一种基于结构信息原理的离线分层扩散框架

专知会员服务

8+阅读 · 2025年9月30日

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

专知会员服务

9+阅读 · 2025年8月1日

【ICML2025】生成模型中潜空间的Hessian几何结构

【ICML2025】生成模型中潜空间的Hessian几何结构

专知会员服务

17+阅读 · 2025年6月15日

【斯坦福博士论文】用于视觉理解及其扩展的几何深度表示

【斯坦福博士论文】用于视觉理解及其扩展的几何深度表示

专知会员服务

16+阅读 · 2025年6月8日

【CVPR2023】DiffCollage:用扩散模型并行生成大量内容

【CVPR2023】DiffCollage:用扩散模型并行生成大量内容

专知会员服务

28+阅读 · 2023年4月4日

【NeurIPS2021】Spatial Ensemble：一种新颖的用于学生-老师框架的模型平滑机制

【NeurIPS2021】Spatial Ensemble：一种新颖的用于学生-老师框架的模型平滑机制

专知会员服务

18+阅读 · 2021年11月8日

【论文推荐】一种用于逆合成预测的图到图框架，A Graph to Graphs Framework for Retrosynthesis Prediction

【论文推荐】一种用于逆合成预测的图到图框架，A Graph to Graphs Framework for Retrosynthesis Prediction

专知会员服务

12+阅读 · 2020年4月1日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

24+阅读 · 2022年10月24日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

【泡泡点云时空】StereoDRNet：基于扩张卷积的双目残差网络

【泡泡点云时空】StereoDRNet：基于扩张卷积的双目残差网络

泡泡机器人SLAM

13+阅读 · 2019年9月8日

立体匹配技术简介

立体匹配技术简介

计算机视觉life

28+阅读 · 2019年4月22日

Github项目推荐 | Manopth - PyTorch的MANO层，生成手部网格作为可微分层

Github项目推荐 | Manopth - PyTorch的MANO层，生成手部网格作为可微分层

AI研习社

10+阅读 · 2019年3月20日

总结-空洞卷积(Dilated/Atrous Convolution)

总结-空洞卷积(Dilated/Atrous Convolution)

极市平台

41+阅读 · 2019年2月25日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

机器之心

11+阅读 · 2018年8月6日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

Stokes/Darcy 耦合问题的数值方法及预处理技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

全景聚焦合成孔径成像及其遮挡目标提取研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合光轴方向卷曲空间电磁特异介质的特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

一类稳态Schödinger-Poisson-Slater方程标准化解的研究

国家自然科学基金

1+阅读 · 2015年12月31日

顾及异方差与空间约束的高光谱混合像元模糊聚类分解方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

异源主被动遥感多视立体成像几何模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

全空间中临界Surface Quasi-geostrophic方程的全局吸引子及其分形维数

国家自然科学基金

0+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

分形几何中的嵌入问题

国家自然科学基金

0+阅读 · 2014年12月31日

MMDiff: Extending Diffusion Transformers for Multi-Modal Generation

Arxiv

0+阅读 · 6月15日

MUNI: Multimodal Unified Latent Diffusion for Coherent Any-to-Any Generation

Arxiv

0+阅读 · 6月15日

On the Geometry of Separation in Finite Gaussian Mixtures

Arxiv

0+阅读 · 6月15日

ST-DiffEye: Diffusion-based Continuous Gaze Generation via Joint Scanpath-Trajectory Modeling

Arxiv

0+阅读 · 6月13日

StereoGeo: an end-to-end stereo camera calibration method

StereoGeo: an end-to-end stereo camera calibration method

Arxiv

0+阅读 · 6月12日

PolycubeNet: A Dual-latent Diffusion Model for Polycube-Based Hexahedral Mesh Generation

Arxiv

0+阅读 · 5月19日

Stratified Topological Autonomy for Long-Range Coordination (STALC)

Arxiv

0+阅读 · 4月23日

StereoFoley: Object-Aware Stereo Audio Generation from Video

Arxiv

0+阅读 · 4月17日

AnchorSplat: Feed-Forward 3D Gaussian Splatting with 3D Geometric Priors

Arxiv

0+阅读 · 4月9日

PhysGaia: A Physics-Aware Benchmark with Multi-Body Interactions for Dynamic Novel View Synthesis

Arxiv

0+阅读 · 4月2日

VIP会员

文章信息

相关主题

PAC学习理论

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

4+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

2+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

2+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

3+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

4+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

3+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

【NeurIPS2025】一种基于结构信息原理的离线分层扩散框架

【NeurIPS2025】一种基于结构信息原理的离线分层扩散框架

专知会员服务

8+阅读 · 2025年9月30日

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

【ICML2025】SToFM：一种用于空间转录组学的多尺度基础模型

专知会员服务

9+阅读 · 2025年8月1日

【ICML2025】生成模型中潜空间的Hessian几何结构

【ICML2025】生成模型中潜空间的Hessian几何结构

专知会员服务

17+阅读 · 2025年6月15日

【斯坦福博士论文】用于视觉理解及其扩展的几何深度表示

【斯坦福博士论文】用于视觉理解及其扩展的几何深度表示

专知会员服务

16+阅读 · 2025年6月8日

【CVPR2023】DiffCollage:用扩散模型并行生成大量内容

【CVPR2023】DiffCollage:用扩散模型并行生成大量内容

专知会员服务

28+阅读 · 2023年4月4日

【NeurIPS2021】Spatial Ensemble：一种新颖的用于学生-老师框架的模型平滑机制

【NeurIPS2021】Spatial Ensemble：一种新颖的用于学生-老师框架的模型平滑机制

专知会员服务

18+阅读 · 2021年11月8日

【论文推荐】一种用于逆合成预测的图到图框架，A Graph to Graphs Framework for Retrosynthesis Prediction

【论文推荐】一种用于逆合成预测的图到图框架，A Graph to Graphs Framework for Retrosynthesis Prediction

专知会员服务

12+阅读 · 2020年4月1日

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

【CVPR2020-Oral-牛津-Facebook】从单个图像进行端到端的视图合成，SynSin-View Synthesis

专知会员服务

29+阅读 · 2020年3月26日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

24+阅读 · 2022年10月24日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

【泡泡点云时空】StereoDRNet：基于扩张卷积的双目残差网络

【泡泡点云时空】StereoDRNet：基于扩张卷积的双目残差网络

泡泡机器人SLAM

13+阅读 · 2019年9月8日

立体匹配技术简介

立体匹配技术简介

计算机视觉life

28+阅读 · 2019年4月22日

Github项目推荐 | Manopth - PyTorch的MANO层，生成手部网格作为可微分层

Github项目推荐 | Manopth - PyTorch的MANO层，生成手部网格作为可微分层

AI研习社

10+阅读 · 2019年3月20日

总结-空洞卷积(Dilated/Atrous Convolution)

总结-空洞卷积(Dilated/Atrous Convolution)

极市平台

41+阅读 · 2019年2月25日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

机器之心

11+阅读 · 2018年8月6日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

相关论文

MMDiff: Extending Diffusion Transformers for Multi-Modal Generation

Arxiv

0+阅读 · 6月15日

MUNI: Multimodal Unified Latent Diffusion for Coherent Any-to-Any Generation

Arxiv

0+阅读 · 6月15日

On the Geometry of Separation in Finite Gaussian Mixtures

Arxiv

0+阅读 · 6月15日

ST-DiffEye: Diffusion-based Continuous Gaze Generation via Joint Scanpath-Trajectory Modeling

Arxiv

0+阅读 · 6月13日

StereoGeo: an end-to-end stereo camera calibration method

StereoGeo: an end-to-end stereo camera calibration method

Arxiv

0+阅读 · 6月12日

PolycubeNet: A Dual-latent Diffusion Model for Polycube-Based Hexahedral Mesh Generation

Arxiv

0+阅读 · 5月19日

Stratified Topological Autonomy for Long-Range Coordination (STALC)

Arxiv

0+阅读 · 4月23日

StereoFoley: Object-Aware Stereo Audio Generation from Video

Arxiv

0+阅读 · 4月17日

AnchorSplat: Feed-Forward 3D Gaussian Splatting with 3D Geometric Priors

Arxiv

0+阅读 · 4月9日

PhysGaia: A Physics-Aware Benchmark with Multi-Body Interactions for Dynamic Novel View Synthesis

Arxiv

0+阅读 · 4月2日

相关基金

Stokes/Darcy 耦合问题的数值方法及预处理技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

全景聚焦合成孔径成像及其遮挡目标提取研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合光轴方向卷曲空间电磁特异介质的特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

一类稳态Schödinger-Poisson-Slater方程标准化解的研究

国家自然科学基金

1+阅读 · 2015年12月31日

顾及异方差与空间约束的高光谱混合像元模糊聚类分解方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

异源主被动遥感多视立体成像几何模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

全空间中临界Surface Quasi-geostrophic方程的全局吸引子及其分形维数

国家自然科学基金

0+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

分形几何中的嵌入问题

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员