MiXR: Harvesting and Recomposing Geometry from Real-World Objects for In-Situ 3D Design - 专知论文

会员服务 ·

0

3D · MoDELS · 设计 · 控制器 · AI ·

MiXR: Harvesting and Recomposing Geometry from Real-World Objects for In-Situ 3D Design

翻译：MiXR：从真实物体中采集与重组几何结构用于原位3D设计

Faraz Faruqi,Demircan Tas,Arthur Caetano,Niccolò Meniconi,Oğuz Arslan,Misha Sra,Ruofei Du,Stefanie Mueller,Mustafa Doga Dogan

from arxiv, 12 pages, 12 figures

Recent developments in 3D generative AI enable users to create bespoke 3D models from text or image prompts. However, these approaches provide limited control over spatial structure, making them ill suited for tasks requiring precise geometric composition. We present MiXR, an XR system for in-situ compositional modeling that enables users to create new 3D models by harvesting geometry from their environment. Users extract segments from captured objects and assemble new artifacts through direct 3D manipulation, while generative AI synthesizes a coherent model from the user-defined composition. This hybrid workflow allows users to define spatial structure explicitly while delegating geometric refinement to generative models, enabling them to specify spatial intent that is difficult to express through verbal prompts alone. In a controlled user study ($N=12$), participants using MiXR rated their designs as significantly closer to the target, felt more in control, and experienced lower cognitive workload compared to a generative composition baseline.

翻译：近期3D生成式AI的发展使得用户能够根据文本或图像提示创建定制化的3D模型。然而，这些方法对空间结构的控制能力有限，难以满足需要精确几何构成的任务需求。我们提出MiXR——一个面向原位组合式建模的扩展现实（XR）系统，使用户能够从环境中采集几何结构来创建新的3D模型。用户从捕获的物体中提取片段，通过直接3D操作组装新构件，同时生成式AI根据用户定义的组合合成连贯的模型。这种混合工作流程允许用户明确指定空间结构，同时将几何细化工作委托给生成模型，从而能够表达那些难以通过文字提示准确描述的空间意图。在受控用户研究（$N=12$）中，与生成式组合基线方法相比，使用MiXR的参与者认为其设计更接近目标、感受到更强的控制力，且认知负荷更低。

0

相关内容

3D是英文“Three Dimensions”的简称，中文是指三维、三个维度、三个坐标，即有长、有宽、有高，换句话说，就是立体的，是相对于只有长和宽的平面（2D）而言。

【CVPR2026】SwiftTailor：利用几何图像表示实现高效的 3D 服装生成。

【CVPR2026】SwiftTailor：利用几何图像表示实现高效的 3D 服装生成。

专知会员服务

6+阅读 · 3月22日

哈佛最新《面向系统设计的生成式 AI：从软件到硅片的重复性挑战与设计原则》

哈佛最新《面向系统设计的生成式 AI：从软件到硅片的重复性挑战与设计原则》

专知会员服务

16+阅读 · 3月3日

【ETHZ博士论文】真实世界约束下的2D和3D生成模型

【ETHZ博士论文】真实世界约束下的2D和3D生成模型

专知会员服务

25+阅读 · 2024年9月2日

【ETHZ博士论文】增强现实中3D场景的重建、理解与编辑

【ETHZ博士论文】增强现实中3D场景的重建、理解与编辑

专知会员服务

34+阅读 · 2024年2月17日

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

专知会员服务

48+阅读 · 2023年4月20日

Mix数据增强怎么做？香港城市大学最新《混合数据增强》综述，全面阐述MixDA方法、应用与可解释性

Mix数据增强怎么做？香港城市大学最新《混合数据增强》综述，全面阐述MixDA方法、应用与可解释性

专知会员服务

30+阅读 · 2022年12月29日

《通过人工智能和计算几何从卫星图像中重建 3D 环境以在混合现实中进行开发》北约科技组织2022最新14页报告

《通过人工智能和计算几何从卫星图像中重建 3D 环境以在混合现实中进行开发》北约科技组织2022最新14页报告

专知会员服务

39+阅读 · 2022年11月1日

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

专知会员服务

34+阅读 · 2022年10月27日

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

专知会员服务

39+阅读 · 2022年8月9日

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

专知会员服务

21+阅读 · 2020年6月13日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

三维重建 3D reconstruction 有哪些实用算法？

三维重建 3D reconstruction 有哪些实用算法？

极市平台

13+阅读 · 2020年2月23日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

使用双目相机进行三维重建第二部分：姿态估计

使用双目相机进行三维重建第二部分：姿态估计

AI研习社

12+阅读 · 2019年5月7日

多图带你读懂 Transformers 的工作原理

多图带你读懂 Transformers 的工作原理

AI研习社

10+阅读 · 2019年3月18日

【学界】李飞飞学生最新论文：利用场景图生成图像

【学界】李飞飞学生最新论文：利用场景图生成图像

GAN生成式对抗网络

15+阅读 · 2018年4月9日

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

AI研习社

10+阅读 · 2018年3月6日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

基于体素划分模型的多视图深度信息融合三维重建研究

国家自然科学基金

2+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

几何/拓扑混合空间中的仿生导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

纳米修饰与3D打印联用技术在医用材料中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

面向测量/加工一体化的强反光复杂金属结构件原位测量方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Kairos: A Native World Model Stack for Physical AI

Arxiv

0+阅读 · 6月16日

Kairos: A Native World Model Stack for Physical AI

Arxiv

0+阅读 · 6月15日

SceneCraft: Interactive System for Image Editing via Scene Graph

Arxiv

0+阅读 · 6月15日

MooMIns -- Monocular 3D Reconstruction and Object Pose Estimation from Multiple Instances

Arxiv

0+阅读 · 6月12日

GeM-NR: Geometry-Aware Multi-View Editing for Nonrigid Scene Changes

Arxiv

0+阅读 · 6月3日

SimuScene: Simulation-Ready Compositional 3D Scene Reconstruction from a Single Image

Arxiv

0+阅读 · 6月2日

REST3D: Reconstructing Physically Stable 3D Scenes from a Single Image

Arxiv

0+阅读 · 5月28日

Zatom-1: Towards a Multimodal Foundation Model for 3D Molecules and Materials

Arxiv

0+阅读 · 5月13日

SpatialPrompt: XR-Based Spatial Intent Expression as Executable Constraints for AI Generative 3D Design

Arxiv

0+阅读 · 5月8日

UniCorrn: Unified Correspondence Transformer Across 2D and 3D

Arxiv

0+阅读 · 5月5日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

9+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

【CVPR2026】SwiftTailor：利用几何图像表示实现高效的 3D 服装生成。

【CVPR2026】SwiftTailor：利用几何图像表示实现高效的 3D 服装生成。

专知会员服务

6+阅读 · 3月22日

哈佛最新《面向系统设计的生成式 AI：从软件到硅片的重复性挑战与设计原则》

哈佛最新《面向系统设计的生成式 AI：从软件到硅片的重复性挑战与设计原则》

专知会员服务

16+阅读 · 3月3日

【ETHZ博士论文】真实世界约束下的2D和3D生成模型

【ETHZ博士论文】真实世界约束下的2D和3D生成模型

专知会员服务

25+阅读 · 2024年9月2日

【ETHZ博士论文】增强现实中3D场景的重建、理解与编辑

【ETHZ博士论文】增强现实中3D场景的重建、理解与编辑

专知会员服务

34+阅读 · 2024年2月17日

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

专知会员服务

48+阅读 · 2023年4月20日

Mix数据增强怎么做？香港城市大学最新《混合数据增强》综述，全面阐述MixDA方法、应用与可解释性

Mix数据增强怎么做？香港城市大学最新《混合数据增强》综述，全面阐述MixDA方法、应用与可解释性

专知会员服务

30+阅读 · 2022年12月29日

《通过人工智能和计算几何从卫星图像中重建 3D 环境以在混合现实中进行开发》北约科技组织2022最新14页报告

《通过人工智能和计算几何从卫星图像中重建 3D 环境以在混合现实中进行开发》北约科技组织2022最新14页报告

专知会员服务

39+阅读 · 2022年11月1日

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

伦敦大学学院最新《三维图像合成技术》综述，26页pdf阐述3D图像合成技术进展

专知会员服务

34+阅读 · 2022年10月27日

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

专知会员服务

39+阅读 · 2022年8月9日

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

专知会员服务

21+阅读 · 2020年6月13日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

三维重建 3D reconstruction 有哪些实用算法？

三维重建 3D reconstruction 有哪些实用算法？

极市平台

13+阅读 · 2020年2月23日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

使用双目相机进行三维重建第二部分：姿态估计

使用双目相机进行三维重建第二部分：姿态估计

AI研习社

12+阅读 · 2019年5月7日

多图带你读懂 Transformers 的工作原理

多图带你读懂 Transformers 的工作原理

AI研习社

10+阅读 · 2019年3月18日

【学界】李飞飞学生最新论文：利用场景图生成图像

【学界】李飞飞学生最新论文：利用场景图生成图像

GAN生成式对抗网络

15+阅读 · 2018年4月9日

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

AI研习社

10+阅读 · 2018年3月6日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

相关论文

Kairos: A Native World Model Stack for Physical AI

Arxiv

0+阅读 · 6月16日

Kairos: A Native World Model Stack for Physical AI

Arxiv

0+阅读 · 6月15日

SceneCraft: Interactive System for Image Editing via Scene Graph

Arxiv

0+阅读 · 6月15日

MooMIns -- Monocular 3D Reconstruction and Object Pose Estimation from Multiple Instances

Arxiv

0+阅读 · 6月12日

GeM-NR: Geometry-Aware Multi-View Editing for Nonrigid Scene Changes

Arxiv

0+阅读 · 6月3日

SimuScene: Simulation-Ready Compositional 3D Scene Reconstruction from a Single Image

Arxiv

0+阅读 · 6月2日

REST3D: Reconstructing Physically Stable 3D Scenes from a Single Image

Arxiv

0+阅读 · 5月28日

Zatom-1: Towards a Multimodal Foundation Model for 3D Molecules and Materials

Arxiv

0+阅读 · 5月13日

SpatialPrompt: XR-Based Spatial Intent Expression as Executable Constraints for AI Generative 3D Design

Arxiv

0+阅读 · 5月8日

UniCorrn: Unified Correspondence Transformer Across 2D and 3D

Arxiv

0+阅读 · 5月5日

相关基金

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

基于体素划分模型的多视图深度信息融合三维重建研究

国家自然科学基金

2+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

几何/拓扑混合空间中的仿生导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

纳米修饰与3D打印联用技术在医用材料中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

面向测量/加工一体化的强反光复杂金属结构件原位测量方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员