Humans naturally understand object physics through everyday interactions, but faithfully predicting complex deformable dynamics, such as elastic materials and fabrics, remains a major challenge for computer vision and robotics. We present EgoPhys, a framework that constructs deformable physical digital twins from egocentric RGB-only video using generalizable priors. EgoPhys overcomes the limitations of existing methods to enable controllable deformable digital twin generation from egocentric videos by distilling per-object inverse-physics solutions into a compact codebook, enabling prediction of dense spring stiffness fields for unseen objects without per-spring test-time optimization. Trained with generalizable priors from diverse egocentric interactions, EgoPhys outperforms baselines in reconstruction, future prediction, and zero-shot generalization. To support training and evaluation, we curate an egocentric interaction dataset covering diverse deformable objects, scenes, and manipulation styles. We deploy EgoPhys on a real xArm6 robot, demonstrating that a digital twin initialized from a single egocentric human play video can serve as an internal world representation to aid in deformable-object planning, highlighting egocentric RGB observations as a scalable path toward real-to-sim pipelines.


翻译:人类通过日常交互本能地理解物体物理属性,但准确预测弹性材料、织物等复杂可变形动力学行为仍是计算机视觉与机器人领域的重大挑战。本文提出EgoPhys框架,该框架利用通用先验从仅含RGB信息的第一人称视频构建可变形物理数字孪生。通过将逐物体逆物理求解结果蒸馏为紧凑码本,EgoPhys为未见物体预测密集弹簧刚度场且无需逐弹簧测试时优化,从而突破现有方法局限,实现从第一人称视频生成可控可变形数字孪生。经多样化的第一人称交互通用先验训练后,EgoPhys在重建、未来预测及零样本泛化方面均优于基线方法。为支撑训练与评估,我们构建了涵盖多样化可变形物体、场景及操作风格的第一人称交互数据集。将EgoPhys部署于真实xArm6机器人实验表明,从单段第一人称人类操作视频初始化的数字孪生可作为内部世界表征,辅助可变形物体规划任务,验证了第一人称RGB观测实现真实到仿真流水线的可扩展路径。

0
下载
关闭预览

相关内容

物理学中的高级深度学习
专知会员服务
20+阅读 · 2025年12月9日
【新书】基于物理的模拟
专知会员服务
23+阅读 · 2025年7月25日
Meta-Transformer:多模态学习的统一框架
专知会员服务
59+阅读 · 2023年7月21日
ExBert — 可视化分析Transformer学到的表示
专知会员服务
32+阅读 · 2019年10月16日
从头开始了解Transformer
AI科技评论
25+阅读 · 2019年8月28日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
VIP会员
最新内容
《通过小型无人机系统将情报能力“作战化”》
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
《离线语言支持系统:面向空战战术决策》
专知会员服务
9+阅读 · 6月15日
相关VIP内容
物理学中的高级深度学习
专知会员服务
20+阅读 · 2025年12月9日
【新书】基于物理的模拟
专知会员服务
23+阅读 · 2025年7月25日
Meta-Transformer:多模态学习的统一框架
专知会员服务
59+阅读 · 2023年7月21日
ExBert — 可视化分析Transformer学到的表示
专知会员服务
32+阅读 · 2019年10月16日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员