物理一致物体间推理的高杂乱环境真实到仿真转换 (Real-to-Sim for Highly Cluttered Environments via Physics-Consistent Inter-Object Reasoning) - 专知论文

会员服务 ·

0

一致 · 重建 · 操作 · 物理约束 · 约束 ·

Real-to-Sim for Highly Cluttered Environments via Physics-Consistent Inter-Object Reasoning

翻译：物理一致物体间推理的高杂乱环境真实到仿真转换

Tianyi Xiang,Jiahang Cao,Sikai Guo,Guoyang Zhao,Andrew F. Luo,Jun Ma

from arxiv, Project page: https://physics-constrained-real2sim.github.io

Reconstructing physically valid 3D scenes from single-view observations is a prerequisite for bridging the gap between visual perception and robotic control. However, in scenarios requiring precise contact reasoning, such as robotic manipulation in highly cluttered environments, geometric fidelity alone is insufficient. Standard perception pipelines often neglect physical constraints, resulting in invalid states, e.g., floating objects or severe inter-penetration, rendering downstream simulation unreliable. To address these limitations, we propose a novel physics-constrained Real-to-Sim pipeline that reconstructs physically consistent 3D scenes from single-view RGB-D data. Central to our approach is a differentiable optimization pipeline that explicitly models spatial dependencies via a contact graph, jointly refining object poses and physical properties through differentiable rigid-body simulation. Extensive evaluations in both simulation and real-world settings demonstrate that our reconstructed scenes achieve high physical fidelity and faithfully replicate real-world contact dynamics, enabling stable and reliable contact-rich manipulation.

翻译：从单视角观测重建物理有效的三维场景是连接视觉感知与机器人控制的前提。然而，在需要精确接触推理的场景中（例如高度杂乱环境下的机器人操作），仅靠几何保真度是不够的。标准感知流程通常忽略物理约束，导致无效状态（如物体悬浮或严重相互穿透），使得下游仿真不可靠。为解决这些局限，我们提出一种新颖的物理约束真实到仿真流程，可从单视角RGB-D数据重建物理一致的三维场景。我们方法的核心是一个可微分优化流程，该流程通过接触图显式建模空间依赖关系，并借助可微分刚体仿真联合优化物体位姿与物理属性。在仿真和真实环境中的大量评估表明，我们重建的场景实现了高物理保真度，并忠实地复现了真实世界的接触动力学，从而实现了稳定可靠的密集接触操作。

0

相关内容

物理学中的高级深度学习

物理学中的高级深度学习

专知会员服务

19+阅读 · 2025年12月9日

【牛津博士论文】无监督物体学习（Unsupervised Object Learning）

【牛津博士论文】无监督物体学习（Unsupervised Object Learning）

专知会员服务

14+阅读 · 2025年11月30日

多模态大型语言模型中的空间推理：任务、基准和方法综述

多模态大型语言模型中的空间推理：任务、基准和方法综述

专知会员服务

22+阅读 · 2025年11月21日

【NTU博士论文】面向高效感知与可扩展生成的三维物理世界

【NTU博士论文】面向高效感知与可扩展生成的三维物理世界

专知会员服务

12+阅读 · 2025年10月3日

【MIT博士论文】从现实世界中学习并为现实世界服务的三维建模与仿真，251页pdf

【MIT博士论文】从现实世界中学习并为现实世界服务的三维建模与仿真，251页pdf

专知会员服务

32+阅读 · 2024年3月26日

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

专知会员服务

38+阅读 · 2023年6月22日

【斯坦福博士论文】具有高效时空推理的三维场景理解，122页pdf

【斯坦福博士论文】具有高效时空推理的三维场景理解，122页pdf

专知会员服务

37+阅读 · 2022年9月26日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

专知会员服务

68+阅读 · 2020年11月9日

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

专知会员服务

10+阅读 · 2020年3月27日

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

27+阅读 · 2020年7月26日

【仿真+AI】浅谈AI在CAE领域的应用

【仿真+AI】浅谈AI在CAE领域的应用

产业智能官

13+阅读 · 2019年12月7日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

SkeletonNet：完整的人体三维位姿重建方法

SkeletonNet：完整的人体三维位姿重建方法

计算机视觉life

21+阅读 · 2019年1月21日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

【学界】实景照片秒变新海诚风格漫画：清华大学提出CartoonGAN

【学界】实景照片秒变新海诚风格漫画：清华大学提出CartoonGAN

GAN生成式对抗网络

14+阅读 · 2018年6月20日

深度学习与物理学的大碰撞思考（附slides下载）

深度学习与物理学的大碰撞思考（附slides下载）

专知

14+阅读 · 2017年11月30日

动态环境下的实时高清大规模三维地形重建研究

国家自然科学基金

3+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

新视觉模型下非完整移动机器人同时镇定和跟踪控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下面向激光扫描点云的三维目标定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于环境异质信息的机器觉察与仿生知觉方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

多视环境下基于变分水平集的场景流估计

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

Benchmarking the Effects of Object Pose Estimation and Reconstruction on Robotic Grasping Success

Arxiv

0+阅读 · 2月19日

Learning Situated Awareness in the Real World

Arxiv

0+阅读 · 2月18日

Simulating the Real World: A Unified Survey of Multimodal Generative Models

Arxiv

0+阅读 · 2月16日

PhyScensis: Physics-Augmented LLM Agents for Complex Physical Scene Arrangement

Arxiv

0+阅读 · 2月16日

ReaDy-Go: Real-to-Sim Dynamic 3D Gaussian Splatting Simulation for Environment-Specific Visual Navigation with Moving Obstacles

Arxiv

0+阅读 · 2月12日

Picasso: Holistic Scene Reconstruction with Physics-Constrained Sampling

Arxiv

0+阅读 · 2月8日

InterPrior: Scaling Generative Control for Physics-Based Human-Object Interactions

Arxiv

0+阅读 · 2月5日

PhysBrain: Human Egocentric Data as a Bridge from Vision Language Models to Physical Intelligence

Arxiv

0+阅读 · 2月4日

PhysicsMind: Sim and Real Mechanics Benchmarking for Physical Reasoning and Prediction in Foundational VLMs and World Models

Arxiv

0+阅读 · 1月22日

Active Cross-Modal Visuo-Tactile Perception of Deformable Linear Objects

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

相关VIP内容

物理学中的高级深度学习

物理学中的高级深度学习

专知会员服务

19+阅读 · 2025年12月9日

【牛津博士论文】无监督物体学习（Unsupervised Object Learning）

【牛津博士论文】无监督物体学习（Unsupervised Object Learning）

专知会员服务

14+阅读 · 2025年11月30日

多模态大型语言模型中的空间推理：任务、基准和方法综述

多模态大型语言模型中的空间推理：任务、基准和方法综述

专知会员服务

22+阅读 · 2025年11月21日

【NTU博士论文】面向高效感知与可扩展生成的三维物理世界

【NTU博士论文】面向高效感知与可扩展生成的三维物理世界

专知会员服务

12+阅读 · 2025年10月3日

【MIT博士论文】从现实世界中学习并为现实世界服务的三维建模与仿真，251页pdf

【MIT博士论文】从现实世界中学习并为现实世界服务的三维建模与仿真，251页pdf

专知会员服务

32+阅读 · 2024年3月26日

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

专知会员服务

38+阅读 · 2023年6月22日

【斯坦福博士论文】具有高效时空推理的三维场景理解，122页pdf

【斯坦福博士论文】具有高效时空推理的三维场景理解，122页pdf

专知会员服务

37+阅读 · 2022年9月26日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

专知会员服务

68+阅读 · 2020年11月9日

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

专知会员服务

10+阅读 · 2020年3月27日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

27+阅读 · 2020年7月26日

【仿真+AI】浅谈AI在CAE领域的应用

【仿真+AI】浅谈AI在CAE领域的应用

产业智能官

13+阅读 · 2019年12月7日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

SkeletonNet：完整的人体三维位姿重建方法

SkeletonNet：完整的人体三维位姿重建方法

计算机视觉life

21+阅读 · 2019年1月21日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

【学界】实景照片秒变新海诚风格漫画：清华大学提出CartoonGAN

【学界】实景照片秒变新海诚风格漫画：清华大学提出CartoonGAN

GAN生成式对抗网络

14+阅读 · 2018年6月20日

深度学习与物理学的大碰撞思考（附slides下载）

深度学习与物理学的大碰撞思考（附slides下载）

专知

14+阅读 · 2017年11月30日

相关论文

Benchmarking the Effects of Object Pose Estimation and Reconstruction on Robotic Grasping Success

Arxiv

0+阅读 · 2月19日

Learning Situated Awareness in the Real World

Arxiv

0+阅读 · 2月18日

Simulating the Real World: A Unified Survey of Multimodal Generative Models

Arxiv

0+阅读 · 2月16日

PhyScensis: Physics-Augmented LLM Agents for Complex Physical Scene Arrangement

Arxiv

0+阅读 · 2月16日

ReaDy-Go: Real-to-Sim Dynamic 3D Gaussian Splatting Simulation for Environment-Specific Visual Navigation with Moving Obstacles

Arxiv

0+阅读 · 2月12日

Picasso: Holistic Scene Reconstruction with Physics-Constrained Sampling

Arxiv

0+阅读 · 2月8日

InterPrior: Scaling Generative Control for Physics-Based Human-Object Interactions

Arxiv

0+阅读 · 2月5日

PhysBrain: Human Egocentric Data as a Bridge from Vision Language Models to Physical Intelligence

Arxiv

0+阅读 · 2月4日

PhysicsMind: Sim and Real Mechanics Benchmarking for Physical Reasoning and Prediction in Foundational VLMs and World Models

Arxiv

0+阅读 · 1月22日

Active Cross-Modal Visuo-Tactile Perception of Deformable Linear Objects

Arxiv

0+阅读 · 1月20日

相关基金

动态环境下的实时高清大规模三维地形重建研究

国家自然科学基金

3+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

新视觉模型下非完整移动机器人同时镇定和跟踪控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下面向激光扫描点云的三维目标定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于环境异质信息的机器觉察与仿生知觉方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

多视环境下基于变分水平集的场景流估计

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员