Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows - 专知论文

会员服务 ·

0

视频 · 设计 · 预训练 · 物理模拟器 · 物理模拟 ·

Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows

翻译：预训练视频模型作为城市风场可微物理模拟器

Janne Perini,Rafael Bischof,Moab Arar,Ayça Duran,Michael A. Kraus,Siddhartha Mishra,Bernd Bickel

Designing urban spaces that provide pedestrian wind comfort and safety requires time-resolved Computational Fluid Dynamics (CFD) simulations, but their current computational cost makes extensive design exploration impractical. We introduce WinDiNet (Wind Diffusion Network), a pretrained video diffusion model that is repurposed as a fast, differentiable surrogate for this task. Starting from LTX-Video, a 2B-parameter latent video transformer, we fine-tune on 10,000 2D incompressible CFD simulations over procedurally generated building layouts. A systematic study of training regimes, conditioning mechanisms, and VAE adaptation strategies, including a physics-informed decoder loss, identifies a configuration that outperforms purpose-built neural PDE solvers. The resulting model generates full 112-frame rollouts in under a second. As the surrogate is end-to-end differentiable, it doubles as a physics simulator for gradient-based inverse optimization: given an urban footprint layout, we optimize building positions directly through backpropagation to improve wind safety as well as pedestrian wind comfort. Experiments on single- and multi-inlet layouts show that the optimizer discovers effective layouts even under challenging multi-objective configurations, with all improvements confirmed by ground-truth CFD simulations.

翻译：城市空间设计需兼顾行人风舒适性与安全性，这要求进行时间分辨的计算流体动力学（CFD）模拟，但当前计算成本过高使得大规模设计探索难以实现。本文提出WinDiNet（风扩散网络），一种预训练视频扩散模型，通过重新设计将其转化为面向该任务的快速可微替代模型。基于参数规模为2B的潜空间视频变换器LTX-Video，我们在程序化生成的建筑布局上，对10,000个二维不可压缩CFD模拟数据进行了微调。通过系统研究训练策略、条件控制机制及VAE适配策略（含物理感知解码器损失函数），我们确定了超越专用神经PDE求解器的配置方案。最终模型能在1秒内生成完整的112帧推演序列。由于该替代模型具有端到端可微特性，它可同时作为梯度驱动逆优化的物理模拟器：给定城市足迹布局，通过反向传播直接优化建筑位置，以提升风安全性与行人风舒适性。在单入口与多入口布局上的实验表明，即使在复杂多目标配置下，优化器仍能发现有效布局方案，所有改进均经真实CFD模拟验证。

0

相关内容

视频

视频扩散模型综述：基础、实现与应用

视频扩散模型综述：基础、实现与应用

专知会员服务

14+阅读 · 2025年4月24日

预训练视觉模型的参数高效微调

预训练视觉模型的参数高效微调

专知会员服务

32+阅读 · 2024年3月19日

针对预训练视觉模型的参数高效微调

针对预训练视觉模型的参数高效微调

专知会员服务

22+阅读 · 2024年2月7日

《用于空气动力学预测（包括参数不确定性）的多保真度数据融合》2023最新报告

《用于空气动力学预测（包括参数不确定性）的多保真度数据融合》2023最新报告

专知会员服务

31+阅读 · 2024年1月6日

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

专知会员服务

49+阅读 · 2023年12月9日

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

专知会员服务

72+阅读 · 2023年4月3日

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

专知会员服务

87+阅读 · 2022年9月13日

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

专知会员服务

13+阅读 · 2022年3月12日

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

专知会员服务

54+阅读 · 2021年1月21日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

Facebook何恺明团队提出SlowFast网络，视频识别无需预训练

Facebook何恺明团队提出SlowFast网络，视频识别无需预训练

AI前线

10+阅读 · 2018年12月23日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

13+阅读 · 2018年8月15日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

基于无线传感器网络的风电场在线监测和动态风速预测

国家自然科学基金

0+阅读 · 2015年12月31日

矢栅混合的室内三维导航网络模型

国家自然科学基金

0+阅读 · 2015年12月31日

多频微波辐射计强降雨条件下海洋风场反演研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向城市水文模拟的地表空间自动离散方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

湍流大气中微运动粗糙目标散斑场高阶矩和动态特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会化网络媒体数据的城市空气质量监测方法与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

考虑功率预测的风电场有功功率预测控制策略研究

国家自然科学基金

2+阅读 · 2014年12月31日

考虑天气过程随机性的风电场群概率预测及系统优化调度方法

国家自然科学基金

0+阅读 · 2014年12月31日

PhysMetrics.Weather: An Evaluation Framework for Physical Consistency in ML Weather Models

Arxiv

0+阅读 · 6月11日

Stochastic weather generators for high-frequency wind vector time series

Arxiv

0+阅读 · 6月8日

Drifting Models for Surrogate Flow Modeling

Arxiv

0+阅读 · 6月5日

Spatiotemporal dynamics of wind-speed volatility

Arxiv

0+阅读 · 5月8日

Training-Free Adaptive 360-degree Video Streaming via Semantic Potential Fields

Arxiv

0+阅读 · 5月1日

Faster by Design: Interactive Aerodynamics via Neural Surrogates Trained on Expert-Validated CFD

Arxiv

0+阅读 · 4月27日

Storm Surge Modeling, Bias Correction, Graph Neural Networks, Graph Convolution Networks

Arxiv

0+阅读 · 4月22日

Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows

Arxiv

0+阅读 · 4月3日

Follow-Your-Motion: Video Motion Transfer via Efficient Spatial-Temporal Decoupled Finetuning

Arxiv

0+阅读 · 3月30日

Follow-Your-Motion: Video Motion Transfer via Efficient Spatial-Temporal Decoupled Finetuning

Arxiv

0+阅读 · 3月24日

VIP会员

文章信息

相关主题

物理模拟器

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

视频扩散模型综述：基础、实现与应用

视频扩散模型综述：基础、实现与应用

专知会员服务

14+阅读 · 2025年4月24日

预训练视觉模型的参数高效微调

预训练视觉模型的参数高效微调

专知会员服务

32+阅读 · 2024年3月19日

针对预训练视觉模型的参数高效微调

针对预训练视觉模型的参数高效微调

专知会员服务

22+阅读 · 2024年2月7日

《用于空气动力学预测（包括参数不确定性）的多保真度数据融合》2023最新报告

《用于空气动力学预测（包括参数不确定性）的多保真度数据融合》2023最新报告

专知会员服务

31+阅读 · 2024年1月6日

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

专知会员服务

49+阅读 · 2023年12月9日

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

专知会员服务

72+阅读 · 2023年4月3日

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

专知会员服务

87+阅读 · 2022年9月13日

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

专知会员服务

13+阅读 · 2022年3月12日

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

【AAAI2021】Graph Diffusion Network提升交通流量预测精度

专知会员服务

54+阅读 · 2021年1月21日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

Facebook何恺明团队提出SlowFast网络，视频识别无需预训练

Facebook何恺明团队提出SlowFast网络，视频识别无需预训练

AI前线

10+阅读 · 2018年12月23日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

13+阅读 · 2018年8月15日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

相关论文

PhysMetrics.Weather: An Evaluation Framework for Physical Consistency in ML Weather Models

Arxiv

0+阅读 · 6月11日

Stochastic weather generators for high-frequency wind vector time series

Arxiv

0+阅读 · 6月8日

Drifting Models for Surrogate Flow Modeling

Arxiv

0+阅读 · 6月5日

Spatiotemporal dynamics of wind-speed volatility

Arxiv

0+阅读 · 5月8日

Training-Free Adaptive 360-degree Video Streaming via Semantic Potential Fields

Arxiv

0+阅读 · 5月1日

Faster by Design: Interactive Aerodynamics via Neural Surrogates Trained on Expert-Validated CFD

Arxiv

0+阅读 · 4月27日

Storm Surge Modeling, Bias Correction, Graph Neural Networks, Graph Convolution Networks

Arxiv

0+阅读 · 4月22日

Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows

Arxiv

0+阅读 · 4月3日

Follow-Your-Motion: Video Motion Transfer via Efficient Spatial-Temporal Decoupled Finetuning

Arxiv

0+阅读 · 3月30日

Follow-Your-Motion: Video Motion Transfer via Efficient Spatial-Temporal Decoupled Finetuning

Arxiv

0+阅读 · 3月24日

相关基金

基于无线传感器网络的风电场在线监测和动态风速预测

国家自然科学基金

0+阅读 · 2015年12月31日

矢栅混合的室内三维导航网络模型

国家自然科学基金

0+阅读 · 2015年12月31日

多频微波辐射计强降雨条件下海洋风场反演研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向城市水文模拟的地表空间自动离散方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

湍流大气中微运动粗糙目标散斑场高阶矩和动态特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会化网络媒体数据的城市空气质量监测方法与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

考虑功率预测的风电场有功功率预测控制策略研究

国家自然科学基金

2+阅读 · 2014年12月31日

考虑天气过程随机性的风电场群概率预测及系统优化调度方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员