Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows - 专知论文

会员服务 ·

0

视频 · 预训练 · 物理模拟器 · 物理模拟 · 风场 ·

Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows

翻译：预训练视频模型作为城市风场的可微物理模拟器

Janne Perini,Rafael Bischof,Moab Arar,Ayça Duran,Michael A. Kraus,Siddhartha Mishra,Bernd Bickel

Designing urban spaces that provide pedestrian wind comfort and safety requires time-resolved Computational Fluid Dynamics (CFD) simulations, but their current computational cost makes extensive design exploration impractical. We introduce WinDiNet (Wind Diffusion Network), a pretrained video diffusion model that is repurposed as a fast, differentiable surrogate for this task. Starting from LTX-Video, a 2B-parameter latent video transformer, we fine-tune on 10,000 2D incompressible CFD simulations over procedurally generated building layouts. A systematic study of training regimes, conditioning mechanisms, and VAE adaptation strategies, including a physics-informed decoder loss, identifies a configuration that outperforms purpose-built neural PDE solvers. The resulting model generates full 112-frame rollouts in under a second. As the surrogate is end-to-end differentiable, it doubles as a physics simulator for gradient-based inverse optimization: given an urban footprint layout, we optimize building positions directly through backpropagation to improve wind safety as well as pedestrian wind comfort. Experiments on single- and multi-inlet layouts show that the optimizer discovers effective layouts even under challenging multi-objective configurations, with all improvements confirmed by ground-truth CFD simulations.

翻译：设计提升行人风舒适性与安全性的城市空间，需要高时间分辨率的计算流体动力学(CFD)模拟，但目前其计算成本过高，难以进行广泛的设计探索。我们提出WinDiNet（风扩散网络），这是一种将预训练视频扩散模型改造为快速、可微替代模型的方案。该方法基于2B参数潜视频变换器LTX-Video，在程序化生成建筑布局的10,000个二维不可压缩CFD模拟数据上进行微调。通过对训练机制、条件机制及VAE适配策略（包括物理信息解码器损失函数）的系统研究，我们确定了超越专用神经PDE求解器的配置方案。最终模型可在1秒内生成完整的112帧推演结果。由于该替代模型具有端到端可微性，它同时可作为基于梯度的逆向优化物理模拟器：给定城市足迹布局，通过反向传播直接优化建筑位置，以提升风安全性与行人风舒适性。在单入口与多入口布局上的实验表明，该优化器即使在挑战性的多目标配置下也能发现有效布局，所有改进均经基准CFD模拟验证。

0

相关内容

视频

《用于高功率微波反无人机系统设计与性能评估的多物理场仿真框架》

《用于高功率微波反无人机系统设计与性能评估的多物理场仿真框架》

专知会员服务

30+阅读 · 2月27日

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

专知会员服务

24+阅读 · 2025年11月2日

【ECCV2024】优化扩散模型以进行联合轨迹预测和可控生成

【ECCV2024】优化扩散模型以进行联合轨迹预测和可控生成

专知会员服务

15+阅读 · 2024年8月2日

预训练视觉模型的参数高效微调

预训练视觉模型的参数高效微调

专知会员服务

32+阅读 · 2024年3月19日

针对预训练视觉模型的参数高效微调

针对预训练视觉模型的参数高效微调

专知会员服务

22+阅读 · 2024年2月7日

《用于空气动力学预测（包括参数不确定性）的多保真度数据融合》2023最新报告

《用于空气动力学预测（包括参数不确定性）的多保真度数据融合》2023最新报告

专知会员服务

31+阅读 · 2024年1月6日

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

专知会员服务

49+阅读 · 2023年12月9日

跨学科视角下的城市出行流量（OD）建模综述：理论与技术

跨学科视角下的城市出行流量（OD）建模综述：理论与技术

专知会员服务

22+阅读 · 2023年11月13日

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

专知会员服务

13+阅读 · 2022年3月12日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

Facebook何恺明团队提出SlowFast网络，视频识别无需预训练

Facebook何恺明团队提出SlowFast网络，视频识别无需预训练

AI前线

10+阅读 · 2018年12月23日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

13+阅读 · 2018年8月15日

基于无线传感器网络的风电场在线监测和动态风速预测

国家自然科学基金

0+阅读 · 2015年12月31日

基于机电混合数据驱动的风力发电机故障诊断与预测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

多频微波辐射计强降雨条件下海洋风场反演研究

国家自然科学基金

0+阅读 · 2015年12月31日

湍流大气中微运动粗糙目标散斑场高阶矩和动态特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会化网络媒体数据的城市空气质量监测方法与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

风电机组独立变桨距系统概率模糊建模与协调优化控制

国家自然科学基金

0+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

考虑功率预测的风电场有功功率预测控制策略研究

国家自然科学基金

2+阅读 · 2014年12月31日

考虑天气过程随机性的风电场群概率预测及系统优化调度方法

国家自然科学基金

0+阅读 · 2014年12月31日

PhysMetrics.Weather: An Evaluation Framework for Physical Consistency in ML Weather Models

Arxiv

0+阅读 · 6月11日

Drifting Models for Surrogate Flow Modeling

Arxiv

0+阅读 · 6月5日

Spatiotemporal dynamics of wind-speed volatility

Arxiv

0+阅读 · 5月8日

Training-Free Adaptive 360-degree Video Streaming via Semantic Potential Fields

Arxiv

0+阅读 · 5月1日

Faster by Design: Interactive Aerodynamics via Neural Surrogates Trained on Expert-Validated CFD

Arxiv

0+阅读 · 4月27日

Storm Surge Modeling, Bias Correction, Graph Neural Networks, Graph Convolution Networks

Arxiv

0+阅读 · 4月22日

Scaling Video Pretraining for Surgical Foundation Models

Arxiv

0+阅读 · 4月2日

Follow-Your-Motion: Video Motion Transfer via Efficient Spatial-Temporal Decoupled Finetuning

Arxiv

0+阅读 · 3月30日

Follow-Your-Motion: Video Motion Transfer via Efficient Spatial-Temporal Decoupled Finetuning

Arxiv

0+阅读 · 3月24日

Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows

Arxiv

0+阅读 · 3月22日

VIP会员

文章信息

相关主题

物理模拟器

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

5+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

3+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

3+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

3+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

《用于高功率微波反无人机系统设计与性能评估的多物理场仿真框架》

《用于高功率微波反无人机系统设计与性能评估的多物理场仿真框架》

专知会员服务

30+阅读 · 2月27日

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

专知会员服务

24+阅读 · 2025年11月2日

【ECCV2024】优化扩散模型以进行联合轨迹预测和可控生成

【ECCV2024】优化扩散模型以进行联合轨迹预测和可控生成

专知会员服务

15+阅读 · 2024年8月2日

预训练视觉模型的参数高效微调

预训练视觉模型的参数高效微调

专知会员服务

32+阅读 · 2024年3月19日

针对预训练视觉模型的参数高效微调

针对预训练视觉模型的参数高效微调

专知会员服务

22+阅读 · 2024年2月7日

《用于空气动力学预测（包括参数不确定性）的多保真度数据融合》2023最新报告

《用于空气动力学预测（包括参数不确定性）的多保真度数据融合》2023最新报告

专知会员服务

31+阅读 · 2024年1月6日

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

专知会员服务

49+阅读 · 2023年12月9日

跨学科视角下的城市出行流量（OD）建模综述：理论与技术

跨学科视角下的城市出行流量（OD）建模综述：理论与技术

专知会员服务

22+阅读 · 2023年11月13日

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

【CVPR 2022】跨模态检索的协同双流视觉-语言前训练模型，COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for Cross-Modal Retrieval

专知会员服务

13+阅读 · 2022年3月12日

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

基于动态时空图CNNs的交通流预测，Dynamic Spatio-temporal Graph-based CNNs for Traffic Flow Prediction

专知会员服务

136+阅读 · 2020年3月8日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

【泡泡图灵智库】FlowNet3D:在三维点云中学习场景流（CVPR）

泡泡机器人SLAM

13+阅读 · 2019年6月13日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

Facebook何恺明团队提出SlowFast网络，视频识别无需预训练

Facebook何恺明团队提出SlowFast网络，视频识别无需预训练

AI前线

10+阅读 · 2018年12月23日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

13+阅读 · 2018年8月15日

相关论文

PhysMetrics.Weather: An Evaluation Framework for Physical Consistency in ML Weather Models

Arxiv

0+阅读 · 6月11日

Drifting Models for Surrogate Flow Modeling

Arxiv

0+阅读 · 6月5日

Spatiotemporal dynamics of wind-speed volatility

Arxiv

0+阅读 · 5月8日

Training-Free Adaptive 360-degree Video Streaming via Semantic Potential Fields

Arxiv

0+阅读 · 5月1日

Faster by Design: Interactive Aerodynamics via Neural Surrogates Trained on Expert-Validated CFD

Arxiv

0+阅读 · 4月27日

Storm Surge Modeling, Bias Correction, Graph Neural Networks, Graph Convolution Networks

Arxiv

0+阅读 · 4月22日

Scaling Video Pretraining for Surgical Foundation Models

Arxiv

0+阅读 · 4月2日

Follow-Your-Motion: Video Motion Transfer via Efficient Spatial-Temporal Decoupled Finetuning

Arxiv

0+阅读 · 3月30日

Follow-Your-Motion: Video Motion Transfer via Efficient Spatial-Temporal Decoupled Finetuning

Arxiv

0+阅读 · 3月24日

Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows

Arxiv

0+阅读 · 3月22日

相关基金

基于无线传感器网络的风电场在线监测和动态风速预测

国家自然科学基金

0+阅读 · 2015年12月31日

基于机电混合数据驱动的风力发电机故障诊断与预测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

多频微波辐射计强降雨条件下海洋风场反演研究

国家自然科学基金

0+阅读 · 2015年12月31日

湍流大气中微运动粗糙目标散斑场高阶矩和动态特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会化网络媒体数据的城市空气质量监测方法与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

风电机组独立变桨距系统概率模糊建模与协调优化控制

国家自然科学基金

0+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

考虑功率预测的风电场有功功率预测控制策略研究

国家自然科学基金

2+阅读 · 2014年12月31日

考虑天气过程随机性的风电场群概率预测及系统优化调度方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员