DreamHome-Pano: Design-Aware and Conflict-Free Panoramic Interior Generation - 专知论文

会员服务 ·

0

设计 · 结构 · 约束 · 结构约束 · 属性 ·

DreamHome-Pano: Design-Aware and Conflict-Free Panoramic Interior Generation

翻译：DreamHome-Pano：设计感知且无冲突的全景室内生成

Lulu Chen,Yijiang Hu,Yuanqing Liu,Yulong Li,Yue Yang

In modern interior design, the generation of personalized spaces frequently necessitates a delicate balance between rigid architectural structural constraints and specific stylistic preferences. However, existing multi-condition generative frameworks often struggle to harmonize these inputs, leading to "condition conflicts" where stylistic attributes inadvertently compromise the geometric precision of the layout. To address this challenge, we present DreamHome-Pano, a controllable panoramic generation framework designed for high-fidelity interior synthesis. Our approach introduces a Prompt-LLM that serves as a semantic bridge, effectively translating layout constraints and style references into professional descriptive prompts to achieve precise cross-modal alignment. To safeguard architectural integrity during the generative process, we develop a Conflict-Free Control architecture that incorporates structural-aware geometric priors and a multi-condition decoupling strategy, effectively suppressing stylistic interference from eroding the spatial layout. Furthermore, we establish a comprehensive panoramic interior benchmark alongside a multi-stage training pipeline, encompassing progressive Supervised Fine-Tuning (SFT) and Reinforcement Learning (RL). Experimental results demonstrate that DreamHome-Pano achieves a superior balance between aesthetic quality and structural consistency, offering a robust and professional-grade solution for panoramic interior visualization.

翻译：在现代室内设计中，个性化空间的生成常常需要在刚性的建筑结构约束与特定的风格偏好之间达成微妙的平衡。然而，现有的多条件生成框架往往难以协调这些输入，导致"条件冲突"，即风格属性无意中损害了布局的几何精度。为应对这一挑战，我们提出了DreamHome-Pano，一个为高保真室内合成设计的可控全景生成框架。我们的方法引入了一个作为语义桥梁的Prompt-LLM，它能有效地将布局约束和风格参考转化为专业的描述性提示，以实现精确的跨模态对齐。为了在生成过程中保障建筑结构的完整性，我们开发了一种无冲突控制架构，该架构融合了结构感知的几何先验和多条件解耦策略，有效抑制了风格干扰对空间布局的侵蚀。此外，我们建立了一个全面的全景室内基准数据集，并设计了一个多阶段训练流程，包括渐进式监督微调（SFT）和强化学习（RL）。实验结果表明，DreamHome-Pano在美学质量与结构一致性之间实现了卓越的平衡，为全景室内可视化提供了一个鲁棒且专业级的解决方案。

0

相关内容

设计是对现有状的一种重新认识和打破重组的过程，设计让一切变得更美。

[CVPR2026]通过标记化实现多模态大语言模型对建筑平面图的理解、生成与编辑

[CVPR2026]通过标记化实现多模态大语言模型对建筑平面图的理解、生成与编辑

专知会员服务

10+阅读 · 3月13日

【CVPR2025】《VideoMage：文本到视频扩散模型的多主体与运动定制》

【CVPR2025】《VideoMage：文本到视频扩散模型的多主体与运动定制》

专知会员服务

12+阅读 · 2025年3月28日

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

专知会员服务

40+阅读 · 2023年9月27日

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

专知会员服务

48+阅读 · 2023年4月20日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

高精度室内定位研究评述及未来演进展望

专知会员服务

27+阅读 · 2021年9月1日

【SIGIR2020】联合项目推荐和属性推断:一种自适应图卷积网络方法，Joint Item Recommendation and Attribute Inference: An Adaptive Graph Convolutional Network Approach

【SIGIR2020】联合项目推荐和属性推断:一种自适应图卷积网络方法，Joint Item Recommendation and Attribute Inference: An Adaptive Graph Convolutional Network Approach

专知会员服务

29+阅读 · 2020年5月26日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知会员服务

31+阅读 · 2020年3月26日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

专知

30+阅读 · 2022年4月23日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

CCF房产行业聊天问答匹配 Baseline

CCF房产行业聊天问答匹配 Baseline

AINLP

14+阅读 · 2020年10月18日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知

20+阅读 · 2020年3月26日

腾讯未来城市图景WeCity发布，70页PPT详解智慧城市进化之道 | 附报告下载

腾讯未来城市图景WeCity发布，70页PPT详解智慧城市进化之道 | 附报告下载

腾讯研究院

14+阅读 · 2019年11月7日

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

产业智能官

103+阅读 · 2019年3月26日

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

泡泡机器人SLAM

20+阅读 · 2018年12月27日

【泡泡一分钟】RoomNet：端到端房屋布局估计

【泡泡一分钟】RoomNet：端到端房屋布局估计

泡泡机器人SLAM

18+阅读 · 2018年12月4日

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉life

17+阅读 · 2018年5月23日

风格迁移原理及tensorflow实现-附代码

风格迁移原理及tensorflow实现-附代码

机器学习研究会

19+阅读 · 2018年3月25日

城市“建成环境——空间行为”的多尺度影响关系与机理研究

国家自然科学基金

13+阅读 · 2017年12月31日

应对室内多变需求场景的多模通风策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向图形化互联网的建筑空间组合表达与检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性极小建筑空间研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于语义推理的船舶舱室布置进化设计方法

国家自然科学基金

0+阅读 · 2015年12月31日

参数化风景园林空间密度研究——以建成环境为例

国家自然科学基金

0+阅读 · 2014年12月31日

室内眩光的视觉模型研究

国家自然科学基金

2+阅读 · 2014年12月31日

作为设计方法的湘西农村自建住宅自适应机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态聚光建筑表皮的集成设计与能量生产特性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于“数字链”系统的建筑设计与数控建造

国家自然科学基金

2+阅读 · 2014年12月31日

DreamFlow: Local Navigation Beyond Observation via Conditional Flow Matching in the Latent Space

Arxiv

0+阅读 · 3月17日

Intelligent Co-Design: An Interactive LLM Framework for Interior Spatial Design via Multi-Modal Agents

Arxiv

0+阅读 · 3月16日

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360° Indoor Environments

Arxiv

0+阅读 · 3月10日

Roomify: Spatially-Grounded Style Transformation for Immersive Virtual Environments

Arxiv

0+阅读 · 3月5日

DreamAnywhere: Object-Centric Panoramic 3D Scene Generation

Arxiv

0+阅读 · 2月17日

LighthouseGS: Indoor Structure-aware 3D Gaussian Splatting for Panorama-Style Mobile Captures

Arxiv

0+阅读 · 2月11日

AIDED: Augmenting Interior Design with Human Experience Data for Designer-AI Co-Design

Arxiv

0+阅读 · 2月10日

SceneSmith: Agentic Generation of Simulation-Ready Indoor Scenes

Arxiv

0+阅读 · 2月9日

PEGAsus: 3D Personalization of Geometry and Appearance

Arxiv

0+阅读 · 2月9日

DesignAsCode: Bridging Structural Editability and Visual Fidelity in Graphic Design Generation

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

现代战争的隐蔽系统：伊朗战争十大启示

现代战争的隐蔽系统：伊朗战争十大启示

专知会员服务

0+阅读 · 今天3:58

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

3+阅读 · 6月26日

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

4+阅读 · 6月26日

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

12+阅读 · 6月26日

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

5+阅读 · 6月26日

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

4+阅读 · 6月26日

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

3+阅读 · 6月26日

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

9+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

相关VIP内容

[CVPR2026]通过标记化实现多模态大语言模型对建筑平面图的理解、生成与编辑

[CVPR2026]通过标记化实现多模态大语言模型对建筑平面图的理解、生成与编辑

专知会员服务

10+阅读 · 3月13日

【CVPR2025】《VideoMage：文本到视频扩散模型的多主体与运动定制》

【CVPR2025】《VideoMage：文本到视频扩散模型的多主体与运动定制》

专知会员服务

12+阅读 · 2025年3月28日

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

专知会员服务

40+阅读 · 2023年9月27日

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

如何生成复杂逼真3D场景？CVPR2023英伟达等提出《分层潜在扩散模型》生成复杂的开放世界3D场景

专知会员服务

48+阅读 · 2023年4月20日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

高精度室内定位研究评述及未来演进展望

专知会员服务

27+阅读 · 2021年9月1日

【SIGIR2020】联合项目推荐和属性推断:一种自适应图卷积网络方法，Joint Item Recommendation and Attribute Inference: An Adaptive Graph Convolutional Network Approach

【SIGIR2020】联合项目推荐和属性推断:一种自适应图卷积网络方法，Joint Item Recommendation and Attribute Inference: An Adaptive Graph Convolutional Network Approach

专知会员服务

29+阅读 · 2020年5月26日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知会员服务

31+阅读 · 2020年3月26日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

无人机自主控制与人工智能：系统性综述

现代战争的隐蔽系统：伊朗战争十大启示

GNN跨域综述：从消息传递到图基础模型

相关资讯

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

专知

30+阅读 · 2022年4月23日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

CCF房产行业聊天问答匹配 Baseline

CCF房产行业聊天问答匹配 Baseline

AINLP

14+阅读 · 2020年10月18日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知

20+阅读 · 2020年3月26日

腾讯未来城市图景WeCity发布，70页PPT详解智慧城市进化之道 | 附报告下载

腾讯未来城市图景WeCity发布，70页PPT详解智慧城市进化之道 | 附报告下载

腾讯研究院

14+阅读 · 2019年11月7日

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

产业智能官

103+阅读 · 2019年3月26日

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

【泡泡图灵智库】Complex-YOLO：一个用于实时点云3D目标检测的欧拉区域提议网络（arXiv）

泡泡机器人SLAM

20+阅读 · 2018年12月27日

【泡泡一分钟】RoomNet：端到端房屋布局估计

【泡泡一分钟】RoomNet：端到端房屋布局估计

泡泡机器人SLAM

18+阅读 · 2018年12月4日

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉life

17+阅读 · 2018年5月23日

风格迁移原理及tensorflow实现-附代码

风格迁移原理及tensorflow实现-附代码

机器学习研究会

19+阅读 · 2018年3月25日

相关论文

DreamFlow: Local Navigation Beyond Observation via Conditional Flow Matching in the Latent Space

Arxiv

0+阅读 · 3月17日

Intelligent Co-Design: An Interactive LLM Framework for Interior Spatial Design via Multi-Modal Agents

Arxiv

0+阅读 · 3月16日

PanoAffordanceNet: Towards Holistic Affordance Grounding in 360° Indoor Environments

Arxiv

0+阅读 · 3月10日

Roomify: Spatially-Grounded Style Transformation for Immersive Virtual Environments

Arxiv

0+阅读 · 3月5日

DreamAnywhere: Object-Centric Panoramic 3D Scene Generation

Arxiv

0+阅读 · 2月17日

LighthouseGS: Indoor Structure-aware 3D Gaussian Splatting for Panorama-Style Mobile Captures

Arxiv

0+阅读 · 2月11日

AIDED: Augmenting Interior Design with Human Experience Data for Designer-AI Co-Design

Arxiv

0+阅读 · 2月10日

SceneSmith: Agentic Generation of Simulation-Ready Indoor Scenes

Arxiv

0+阅读 · 2月9日

PEGAsus: 3D Personalization of Geometry and Appearance

Arxiv

0+阅读 · 2月9日

DesignAsCode: Bridging Structural Editability and Visual Fidelity in Graphic Design Generation

Arxiv

0+阅读 · 2月6日

相关基金

城市“建成环境——空间行为”的多尺度影响关系与机理研究

国家自然科学基金

13+阅读 · 2017年12月31日

应对室内多变需求场景的多模通风策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向图形化互联网的建筑空间组合表达与检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性极小建筑空间研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于语义推理的船舶舱室布置进化设计方法

国家自然科学基金

0+阅读 · 2015年12月31日

参数化风景园林空间密度研究——以建成环境为例

国家自然科学基金

0+阅读 · 2014年12月31日

室内眩光的视觉模型研究

国家自然科学基金

2+阅读 · 2014年12月31日

作为设计方法的湘西农村自建住宅自适应机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态聚光建筑表皮的集成设计与能量生产特性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于“数字链”系统的建筑设计与数控建造

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员