PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World - 专知论文

会员服务 ·

0

ASSETS · INTERACT · 3D · 泛函 · 评论员 ·

PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World

翻译：PhysForge：面向交互式虚拟世界的物理驱动三维资产生成

Yunhan Yang,Chunshi Wang,Junliang Ye,Yang Li,Zanxin Chen,Zehuan Huang,Yao Mu,Zhuo Chen,Chunchao Guo,Xihui Liu

from arxiv, Accepted by ICML 2026. Project Page: https://hku-mmlab.github.io/PhysForge/

Synthesizing physics-grounded 3D assets is a critical bottleneck for interactive virtual worlds and embodied AI. Existing methods predominantly focus on static geometry, overlooking the functional properties essential for interaction. We propose that interactive asset generation must be rooted in functional logic and hierarchical physics. To bridge this gap, we introduce PhysForge, a decoupled two-stage framework supported by PhysDB, a large-scale dataset of 150,000 assets with four-tier physical annotations. First, a VLM acts as a "physical architect" to plan a "Hierarchical Physical Blueprint" defining material, functional, and kinematic constraints. Second, a physics-grounded diffusion model realizes this blueprint by synthesizing high-fidelity geometry alongside precise kinematic parameters via a novel KineVoxel Injection (KVI) mechanism. Experiments demonstrate that PhysForge produces functionally plausible, simulation-ready assets, providing a robust data engine for interactive 3D content and embodied agents.

翻译：合成具有物理真实性的三维资产是交互式虚拟世界和具身人工智能的关键瓶颈。现有方法主要聚焦于静态几何结构，忽略了交互所必需的功能属性。我们提出，交互式资产生成必须根植于功能逻辑与分层物理机制。为填补这一空白，我们引入PhysForge——一个解耦的两阶段框架，其底层依托PhysDB（一个包含15万个资产及四层物理标注的大规模数据集）。首先，视觉语言模型（VLM）作为"物理架构师"，规划出定义材料、功能与运动学约束的"分层物理蓝图"。其次，物理驱动的扩散模型通过新颖的KineVoxel Injection (KVI)机制，在合成高保真几何结构的同时生成精确运动学参数，从而实现该蓝图。实验表明，PhysForge能生成功能合理且可直接用于仿真的资产，为交互式三维内容与具身智能体提供稳健的数据引擎。

0

相关内容

ASSETS

ACM SIGACCESS Conference on Computers and Accessibility是为残疾人和老年人提供与计算机相关的设计、评估、使用和教育研究的首要论坛。我们欢迎提交原始的高质量的有关计算和可访问性的主题。今年，ASSETS首次将其范围扩大到包括关于计算机无障碍教育相关主题的原创高质量研究。官网链接：http://assets19.sigaccess.org/

面向具身智能与机器人仿真的三维生成：综述

面向具身智能与机器人仿真的三维生成：综述

专知会员服务

18+阅读 · 4月30日

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

专知会员服务

44+阅读 · 2025年12月16日

【NTU博士论文】多模态神经三维资产合成

【NTU博士论文】多模态神经三维资产合成

专知会员服务

9+阅读 · 2025年9月30日

【CMU博士论文】《学习生成三维内容：几何、外观与物理》

【CMU博士论文】《学习生成三维内容：几何、外观与物理》

专知会员服务

25+阅读 · 2025年8月26日

三维物体与场景生成的最新进展：综述

三维物体与场景生成的最新进展：综述

专知会员服务

19+阅读 · 2025年4月17日

【ETHZ博士论文】《人类动作与交互的生成式建模》

【ETHZ博士论文】《人类动作与交互的生成式建模》

专知会员服务

16+阅读 · 2025年3月28日

【CVPR2024】PHYSCENE：为体现智能合成的可交互三维场景

【CVPR2024】PHYSCENE：为体现智能合成的可交互三维场景

专知会员服务

19+阅读 · 2024年4月19日

面向虚实融合的人机交互

面向虚实融合的人机交互

专知会员服务

72+阅读 · 2023年6月25日

【西安交大等】元宇宙综述:基本原理、安全性和隐私性，A Survey on Metaverse: Fundamentals, Security, and Privacy

【西安交大等】元宇宙综述:基本原理、安全性和隐私性，A Survey on Metaverse: Fundamentals, Security, and Privacy

专知会员服务

45+阅读 · 2022年3月8日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

专知

30+阅读 · 2022年4月23日

【数字孪生】面向智能制造的数字孪生

【数字孪生】面向智能制造的数字孪生

产业智能官

53+阅读 · 2020年5月10日

【数字孪生】数字孪生技术发展趋势与安全风险浅析

【数字孪生】数字孪生技术发展趋势与安全风险浅析

产业智能官

54+阅读 · 2019年8月28日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

产业智能官

103+阅读 · 2019年3月26日

【数字孪生】【CPS】赛博物理系统CPS和数字孪生介绍

【数字孪生】【CPS】赛博物理系统CPS和数字孪生介绍

产业智能官

19+阅读 · 2019年1月27日

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

计算机视觉life

19+阅读 · 2018年12月27日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

基于多元互信息和快速稀疏多核学习的高光谱遥感影像地物分类

国家自然科学基金

0+阅读 · 2015年12月31日

动态环境下的实时高清大规模三维地形重建研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能穿戴设备的三维图形网格简化与渐进显示方法

国家自然科学基金

2+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

自由视点三维视频中纹理-深度图像联合建模及应用

国家自然科学基金

0+阅读 · 2015年12月31日

二维和三维量子图像的存储、压缩与分割技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

AnimaSpark: A Feed-Forward Method for Animating Arbitrary 3D Objects

Arxiv

0+阅读 · 6月9日

QuadVerse: An Integrated Framework Aligning Visual-Physical Reality for Quadruped Simulation

Arxiv

0+阅读 · 6月8日

PhysAgent: Automating Physics-Based 4D Synthesis via Trajectory-Grounded Multi-Agent Feedback

Arxiv

0+阅读 · 6月7日

SimuScene: Simulation-Ready Compositional 3D Scene Reconstruction from a Single Image

Arxiv

0+阅读 · 6月2日

CubePart: An Open-Vocabulary Part-Controllable 3D Generator

Arxiv

0+阅读 · 5月27日

InHabit: Leveraging Image Foundation Models for Scalable 3D Human Placement

Arxiv

0+阅读 · 5月26日

TelePhysics: Physics-Grounded Multi-Object Scene Generation from a Single Image with Real-Time Interaction

Arxiv

0+阅读 · 5月19日

Articraft: An Agentic System for Scalable Articulated 3D Asset Generation

Arxiv

0+阅读 · 5月14日

Rigel3D: Rig-aware Latents for Animation-Ready 3D Asset Generation

Arxiv

0+阅读 · 5月13日

From Visual Synthesis to Interactive Worlds: Toward Production-Ready 3D Asset Generation

Arxiv

0+阅读 · 5月9日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

面向具身智能与机器人仿真的三维生成：综述

面向具身智能与机器人仿真的三维生成：综述

专知会员服务

18+阅读 · 4月30日

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

专知会员服务

44+阅读 · 2025年12月16日

【NTU博士论文】多模态神经三维资产合成

【NTU博士论文】多模态神经三维资产合成

专知会员服务

9+阅读 · 2025年9月30日

【CMU博士论文】《学习生成三维内容：几何、外观与物理》

【CMU博士论文】《学习生成三维内容：几何、外观与物理》

专知会员服务

25+阅读 · 2025年8月26日

三维物体与场景生成的最新进展：综述

三维物体与场景生成的最新进展：综述

专知会员服务

19+阅读 · 2025年4月17日

【ETHZ博士论文】《人类动作与交互的生成式建模》

【ETHZ博士论文】《人类动作与交互的生成式建模》

专知会员服务

16+阅读 · 2025年3月28日

【CVPR2024】PHYSCENE：为体现智能合成的可交互三维场景

【CVPR2024】PHYSCENE：为体现智能合成的可交互三维场景

专知会员服务

19+阅读 · 2024年4月19日

面向虚实融合的人机交互

面向虚实融合的人机交互

专知会员服务

72+阅读 · 2023年6月25日

【西安交大等】元宇宙综述:基本原理、安全性和隐私性，A Survey on Metaverse: Fundamentals, Security, and Privacy

【西安交大等】元宇宙综述:基本原理、安全性和隐私性，A Survey on Metaverse: Fundamentals, Security, and Privacy

专知会员服务

45+阅读 · 2022年3月8日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

专知

30+阅读 · 2022年4月23日

【数字孪生】面向智能制造的数字孪生

【数字孪生】面向智能制造的数字孪生

产业智能官

53+阅读 · 2020年5月10日

【数字孪生】数字孪生技术发展趋势与安全风险浅析

【数字孪生】数字孪生技术发展趋势与安全风险浅析

产业智能官

54+阅读 · 2019年8月28日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

【数字孪生】超棒PPT解读Digital Twin十大领域应用！

产业智能官

103+阅读 · 2019年3月26日

【数字孪生】【CPS】赛博物理系统CPS和数字孪生介绍

【数字孪生】【CPS】赛博物理系统CPS和数字孪生介绍

产业智能官

19+阅读 · 2019年1月27日

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

计算机视觉life

19+阅读 · 2018年12月27日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

相关论文

AnimaSpark: A Feed-Forward Method for Animating Arbitrary 3D Objects

Arxiv

0+阅读 · 6月9日

QuadVerse: An Integrated Framework Aligning Visual-Physical Reality for Quadruped Simulation

Arxiv

0+阅读 · 6月8日

PhysAgent: Automating Physics-Based 4D Synthesis via Trajectory-Grounded Multi-Agent Feedback

Arxiv

0+阅读 · 6月7日

SimuScene: Simulation-Ready Compositional 3D Scene Reconstruction from a Single Image

Arxiv

0+阅读 · 6月2日

CubePart: An Open-Vocabulary Part-Controllable 3D Generator

Arxiv

0+阅读 · 5月27日

InHabit: Leveraging Image Foundation Models for Scalable 3D Human Placement

Arxiv

0+阅读 · 5月26日

TelePhysics: Physics-Grounded Multi-Object Scene Generation from a Single Image with Real-Time Interaction

Arxiv

0+阅读 · 5月19日

Articraft: An Agentic System for Scalable Articulated 3D Asset Generation

Arxiv

0+阅读 · 5月14日

Rigel3D: Rig-aware Latents for Animation-Ready 3D Asset Generation

Arxiv

0+阅读 · 5月13日

From Visual Synthesis to Interactive Worlds: Toward Production-Ready 3D Asset Generation

Arxiv

0+阅读 · 5月9日

相关基金

基于多元互信息和快速稀疏多核学习的高光谱遥感影像地物分类

国家自然科学基金

0+阅读 · 2015年12月31日

动态环境下的实时高清大规模三维地形重建研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能穿戴设备的三维图形网格简化与渐进显示方法

国家自然科学基金

2+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

自由视点三维视频中纹理-深度图像联合建模及应用

国家自然科学基金

0+阅读 · 2015年12月31日

二维和三维量子图像的存储、压缩与分割技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员