To perform a wide range of daily tasks, robots need to construct a 3D representation that is semantically rich, physically grounded, and structured enough to support task planning and affordance prediction. However, existing approaches primarily focus on semantic retrieval, often overlooking physical and kinematic factors. Methods that attempt to model physical properties typically rely on narrow training sets or single-object modeling, limiting scalability and generalization across diverse object types. To address these challenges, we present PhysGraph, a framework that unifies symbolic reasoning with structured 3D geometry to model kinematic and physical properties in cluttered scenes. Given RGB-D observations, PhysGraph reconstructs object-centric 3D geometry and associates object instances across views. It then decomposes objects into functional parts and infers materials and articulations through visual reasoning. Evaluated on both synthetic and real-world datasets, PhysGraph achieves state-of-the-art results in semantic segmentation, multi-object mass estimation, and articulation prediction. With its simple yet effective design, PhysGraph produces physically consistent and semantically structured scene graphs, serving as a structured 3D representation for downstream tasks such as constraint-aware 3D affordance prediction and real-to-sim transfer, both of which are demonstrated in our experiments.


翻译:摘要:为完成各类日常任务,机器人需构建兼具语义丰富性、物理真实性与结构化程度的三维表征,以支持任务规划与可操作属性预测。然而现有方法主要聚焦语义检索,常忽视物理与运动学因素。当前尝试建立物理属性建模的方法多依赖有限训练集或单一物体建模,限制了其在不同物体类型间的扩展性与泛化能力。针对上述挑战,我们提出PhysGraph框架,该框架将符号推理与结构化三维几何建模相统一,用于建模杂乱场景中的运动学与物理属性。基于RGB-D观测数据,PhysGraph重建以物体为中心的三维几何结构,并跨视角关联物体实例,进而将物体分解为功能部件,通过视觉推理推断材料属性与关节结构。在合成数据集与真实数据集上的评估表明,PhysGraph在语义分割、多物体质量估计与关节预测任务中均达到最优性能。凭借简洁高效的设计,PhysGraph可生成物理一致且语义结构化的场景图,为约束感知的三维可操作性预测及真实-仿真迁移等下游任务提供结构化三维表征——这两项应用均在实验中得到了验证。

0
下载
关闭预览

相关内容

面向具身智能与机器人仿真的三维生成:综述
专知会员服务
17+阅读 · 4月30日
【CMU博士论文】物理世界的视觉感知与深度理解
专知会员服务
21+阅读 · 4月22日
《机器人弹性物体感知技术研究》227页
专知会员服务
18+阅读 · 2025年11月20日
三维物体与场景生成的最新进展:综述
专知会员服务
19+阅读 · 2025年4月17日
「可解释知识图谱推理」最新方法综述
专知会员服务
89+阅读 · 2022年12月17日
面向知识图谱的知识推理综述
专知会员服务
152+阅读 · 2021年11月1日
基于知识图谱的问答系统
PaperWeekly
21+阅读 · 2021年2月8日
【泡泡图灵智库】体积实例感知语义建图与3D对象发现
泡泡机器人SLAM
22+阅读 · 2019年9月7日
【推荐】深度学习思维导图
机器学习研究会
15+阅读 · 2017年8月20日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 53分钟前
定向能反无人机系统最新发展动态
专知会员服务
3+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
2+阅读 · 今天13:33
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员