Recent advances in diffusion-based video generation have achieved remarkable visual realism but still struggle to obey basic physical laws such as gravity, inertia, and collision. Generated objects often move inconsistently across frames, exhibit implausible dynamics, or violate physical constraints, limiting the realism and reliability of AI-generated videos. We address this gap by introducing Physical Simulator In-the-loop Video Generation (PSIVG), a novel framework that integrates a physical simulator into the video diffusion process. Starting from a template video generated by a pre-trained diffusion model, PSIVG reconstructs the 4D scene and foreground object meshes, initializes them within a physical simulator, and generates physically consistent trajectories. These simulated trajectories are then used to guide the video generator toward spatio-temporally physically coherent motion. To further improve texture consistency during object movement, we propose a Test-Time Texture Consistency Optimization (TTCO) technique that adapts text and feature embeddings based on pixel correspondences from the simulator. Comprehensive experiments demonstrate that PSIVG produces videos that better adhere to real-world physics while preserving visual quality and diversity. Project Page: https://vcai.mpi-inf.mpg.de/projects/PSIVG/


翻译:近年来,基于扩散模型的视频生成技术已取得显著视觉真实感,但仍难以遵循重力、惯性和碰撞等基本物理定律。生成物体常出现跨帧运动不一致、动力学行为不合理或违反物理约束等问题,限制了AI生成视频的真实性与可靠性。为解决这一不足,本文提出物理模拟器在环视频生成(PSIVG)——一种将物理模拟器集成到视频扩散过程的新型框架。PSIVG从预训练扩散模型生成的模板视频出发,重建四维场景与前景物体网格,在物理模拟器中初始化并生成物理一致的运动轨迹。这些模拟轨迹随后用于引导视频生成器实现时空物理连贯的运动。为提升物体运动过程中的纹理一致性,我们提出测试时纹理一致性优化(TTCO)技术,该技术基于模拟器提供的像素对应关系自适应调整文本与特征嵌入。综合实验表明,PSIVG生成的视频在保持视觉质量与多样性的同时,能更好地遵循真实世界物理规律。项目页面:https://vcai.mpi-inf.mpg.de/projects/PSIVG/

0
下载
关闭预览

相关内容

【新书】基于物理的模拟
专知会员服务
22+阅读 · 2025年7月25日
视频生成中的物理认知演进探究:一项综述
专知会员服务
17+阅读 · 2025年3月30日
视觉中的生成物理人工智能:综述
专知会员服务
36+阅读 · 2025年1月26日
《AI生成视频评估综述》
专知会员服务
28+阅读 · 2024年10月30日
基于姿态的人物视频生成【附PPT与视频资料】
人工智能前沿讲习班
32+阅读 · 2019年1月28日
视频生成的前沿论文,看我们推荐的7篇就够了
人工智能前沿讲习班
34+阅读 · 2018年12月30日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Arxiv
0+阅读 · 2月13日
VIP会员
相关VIP内容
【新书】基于物理的模拟
专知会员服务
22+阅读 · 2025年7月25日
视频生成中的物理认知演进探究:一项综述
专知会员服务
17+阅读 · 2025年3月30日
视觉中的生成物理人工智能:综述
专知会员服务
36+阅读 · 2025年1月26日
《AI生成视频评估综述》
专知会员服务
28+阅读 · 2024年10月30日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员