PuYun-LDM: A Latent Diffusion Model for High-Resolution Ensemble Weather Forecasts - 专知论文

会员服务 ·

0

潜在 · 高分辨 · 高分辨率 · 掩码 · 掩码自编码MAE ·

PuYun-LDM: A Latent Diffusion Model for High-Resolution Ensemble Weather Forecasts

翻译：PuYun-LDM：一种用于高分辨率集合天气预报的潜在扩散模型

Lianjun Wu,Shengchen Zhu,Yuxuan Liu,Liuyu Kai,Xiaoduan Feng,Duomin Wang,Wenshuo Liu,Jingxuan Zhang,Kelvin Li,Bin Wang

Latent diffusion models (LDMs) suffer from limited diffusability in high-resolution (<=0.25°) ensemble weather forecasting, where diffusability characterizes how easily a latent data distribution can be modeled by a diffusion process. Unlike natural image fields, meteorological fields lack task-agnostic foundation models and explicit semantic structures, making VFM-based regularization inapplicable. Moreover, existing frequency-based approaches impose identical spectral regularization across channels under a homogeneity assumption, which leads to uneven regularization strength under the inter-variable spectral heterogeneity in multivariate meteorological data. To address these challenges, we propose a 3D Masked AutoEncoder (3D-MAE) that encodes weather-state evolution features as an additional conditioning for the diffusion model, together with a Variable-Aware Masked Frequency Modeling (VA-MFM) strategy that adaptively selects thresholds based on the spectral energy distribution of each variable. Together, we propose PuYun-LDM, which enhances latent diffusability and achieves superior performance to ENS at short lead times while remaining comparable to ENS at longer horizons. PuYun-LDM generates a 15-day global forecast with a 6-hour temporal resolution in five minutes on a single NVIDIA H200 GPU, while ensemble forecasts can be efficiently produced in parallel.

翻译：潜在扩散模型（LDMs）在高分辨率（<=0.25°）集合天气预报中面临扩散能力有限的问题，扩散能力表征了扩散过程对潜在数据分布建模的难易程度。与自然图像领域不同，气象场缺乏任务无关的基础模型和明确的语义结构，使得基于视觉基础模型的规整化方法不适用。此外，现有的基于频率的方法在同质性假设下对所有通道施加相同的谱规整化，这导致在多元气象数据的变量间谱异质性下，规整化强度不均衡。为应对这些挑战，我们提出了一种三维掩码自编码器（3D-MAE），用于编码天气状态演变特征，作为扩散模型的额外条件输入；同时提出了一种变量感知掩码频率建模（VA-MFM）策略，该策略根据每个变量的谱能量分布自适应地选择阈值。基于此，我们提出了PuYun-LDM，它增强了潜在扩散能力，在短预报时效上性能优于ENS，同时在长预报时效上仍与ENS相当。PuYun-LDM在单个NVIDIA H200 GPU上，可在五分钟内生成时间分辨率为6小时的15天全球预报，而集合预报可以高效地并行生成。

0

相关内容

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

专知会员服务

14+阅读 · 2025年11月25日

用于强化学习的扩散模型：基础、分类与发展

用于强化学习的扩散模型：基础、分类与发展

专知会员服务

23+阅读 · 2025年10月15日

面向低光照图像增强的扩散模型

面向低光照图像增强的扩散模型

专知会员服务

15+阅读 · 2025年10月11日

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

专知会员服务

59+阅读 · 2025年7月20日

高效扩散模型综述

高效扩散模型综述

专知会员服务

34+阅读 · 2025年2月1日

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

24+阅读 · 2025年1月15日

扩散模型图像超分辨率等综述

扩散模型图像超分辨率等综述

专知会员服务

25+阅读 · 2024年1月2日

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

专知会员服务

54+阅读 · 2023年12月15日

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

专知会员服务

87+阅读 · 2022年10月9日

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

专知会员服务

155+阅读 · 2022年9月5日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

DARPA的“疯狂”概念，就要实现！美国无人集群城市作战应用发展综述

DARPA的“疯狂”概念，就要实现！美国无人集群城市作战应用发展综述

THU数据派

38+阅读 · 2020年10月1日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

174+阅读 · 2019年10月28日

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

AI研习社

40+阅读 · 2018年9月21日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

LSF-SCNN：一种基于CNN的短文本表达模型及相似度计算的全新优化模型

LSF-SCNN：一种基于CNN的短文本表达模型及相似度计算的全新优化模型

全球人工智能

21+阅读 · 2017年10月27日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

基于有限元方法的反应扩散种群模型斑图数值模拟研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于隐马尔可夫模型分析不同天气模态下东亚地区近地面CO2浓度变化特征

国家自然科学基金

0+阅读 · 2015年12月31日

基于理论VFC/LST特征空间的区域蒸散发遥感反演研究

国家自然科学基金

0+阅读 · 2015年12月31日

中高分辨率陆地上空大气气溶胶光学厚度与地表二向性反射率卫星遥感反演研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂海面多波段全极化雷达后向散射机理模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

机载相控阵天气雷达谱参数测量的系统误差分析及订正研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

分布式滑坡形变PSI（永久散射体干涉雷达）监测模型及技术

国家自然科学基金

0+阅读 · 2014年12月31日

考虑天气过程随机性的风电场群概率预测及系统优化调度方法

国家自然科学基金

0+阅读 · 2014年12月31日

Optimal Stopping in Latent Diffusion Models

Arxiv

0+阅读 · 3月2日

ManifoldGD: Training-Free Hierarchical Manifold Guidance for Diffusion-Based Dataset Distillation

Arxiv

0+阅读 · 2月26日

Latent-Augmented Discrete Diffusion Models

Arxiv

0+阅读 · 2月24日

DuoCast: Duo-Probabilistic Diffusion for Precipitation Nowcasting

Arxiv

0+阅读 · 2月13日

Universal Diffusion-Based Probabilistic Downscaling

Arxiv

0+阅读 · 2月12日

SLD-L2S: Hierarchical Subspace Latent Diffusion for High-Fidelity Lip to Speech Synthesis

Arxiv

0+阅读 · 2月12日

Deformation-Recovery Diffusion Model (DRDM): Instance Deformation for Image Manipulation and Synthesis

Arxiv

0+阅读 · 2月11日

Corruption-Aware Training of Latent Video Diffusion Models for Robust Text-to-Video Generation

Arxiv

0+阅读 · 2月11日

ItDPDM: Information-Theoretic Discrete Poisson Diffusion Model

Arxiv

0+阅读 · 2月11日

Conditional diffusion models for downscaling and bias correction of Earth system model precipitation

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

掩码自编码MAE

最新内容

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

1+阅读 · 24分钟前

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

1+阅读 · 26分钟前

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

0+阅读 · 37分钟前

《是“修复情报”还是修复部队？阿富汗反叛乱行动中美军情报调整》400页

《是“修复情报”还是修复部队？阿富汗反叛乱行动中美军情报调整》400页

专知会员服务

0+阅读 · 43分钟前

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

专知会员服务

0+阅读 · 今天3:25

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

专知会员服务

5+阅读 · 今天2:55

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

2+阅读 · 4月23日

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

1+阅读 · 4月23日

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

4+阅读 · 4月23日

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

6+阅读 · 4月23日

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

3+阅读 · 4月23日

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

10+阅读 · 4月23日

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

4+阅读 · 4月23日

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

6+阅读 · 4月23日

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 4月23日

相关VIP内容

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

专知会员服务

14+阅读 · 2025年11月25日

用于强化学习的扩散模型：基础、分类与发展

用于强化学习的扩散模型：基础、分类与发展

专知会员服务

23+阅读 · 2025年10月15日

面向低光照图像增强的扩散模型

面向低光照图像增强的扩散模型

专知会员服务

15+阅读 · 2025年10月11日

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

专知会员服务

59+阅读 · 2025年7月20日

高效扩散模型综述

高效扩散模型综述

专知会员服务

34+阅读 · 2025年2月1日

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

24+阅读 · 2025年1月15日

扩散模型图像超分辨率等综述

扩散模型图像超分辨率等综述

专知会员服务

25+阅读 · 2024年1月2日

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

专知会员服务

54+阅读 · 2023年12月15日

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

专知会员服务

87+阅读 · 2022年10月9日

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

专知会员服务

155+阅读 · 2022年9月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《印度的多域作战：条令与能力发展》报告

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

《多域作战面临复杂现实》

《是“修复情报”还是修复部队？阿富汗反叛乱行动中美军情报调整》400页

相关资讯

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

DARPA的“疯狂”概念，就要实现！美国无人集群城市作战应用发展综述

DARPA的“疯狂”概念，就要实现！美国无人集群城市作战应用发展综述

THU数据派

38+阅读 · 2020年10月1日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

174+阅读 · 2019年10月28日

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

PyTorch 中使用深度学习（CNN和LSTM）的自动图像捕获

AI研习社

40+阅读 · 2018年9月21日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

LSF-SCNN：一种基于CNN的短文本表达模型及相似度计算的全新优化模型

LSF-SCNN：一种基于CNN的短文本表达模型及相似度计算的全新优化模型

全球人工智能

21+阅读 · 2017年10月27日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Optimal Stopping in Latent Diffusion Models

Arxiv

0+阅读 · 3月2日

ManifoldGD: Training-Free Hierarchical Manifold Guidance for Diffusion-Based Dataset Distillation

Arxiv

0+阅读 · 2月26日

Latent-Augmented Discrete Diffusion Models

Arxiv

0+阅读 · 2月24日

DuoCast: Duo-Probabilistic Diffusion for Precipitation Nowcasting

Arxiv

0+阅读 · 2月13日

Universal Diffusion-Based Probabilistic Downscaling

Arxiv

0+阅读 · 2月12日

SLD-L2S: Hierarchical Subspace Latent Diffusion for High-Fidelity Lip to Speech Synthesis

Arxiv

0+阅读 · 2月12日

Deformation-Recovery Diffusion Model (DRDM): Instance Deformation for Image Manipulation and Synthesis

Arxiv

0+阅读 · 2月11日

Corruption-Aware Training of Latent Video Diffusion Models for Robust Text-to-Video Generation

Arxiv

0+阅读 · 2月11日

ItDPDM: Information-Theoretic Discrete Poisson Diffusion Model

Arxiv

0+阅读 · 2月11日

Conditional diffusion models for downscaling and bias correction of Earth system model precipitation

Arxiv

0+阅读 · 2月2日

相关基金

基于有限元方法的反应扩散种群模型斑图数值模拟研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于隐马尔可夫模型分析不同天气模态下东亚地区近地面CO2浓度变化特征

国家自然科学基金

0+阅读 · 2015年12月31日

基于理论VFC/LST特征空间的区域蒸散发遥感反演研究

国家自然科学基金

0+阅读 · 2015年12月31日

中高分辨率陆地上空大气气溶胶光学厚度与地表二向性反射率卫星遥感反演研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂海面多波段全极化雷达后向散射机理模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

机载相控阵天气雷达谱参数测量的系统误差分析及订正研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

分布式滑坡形变PSI（永久散射体干涉雷达）监测模型及技术

国家自然科学基金

0+阅读 · 2014年12月31日

考虑天气过程随机性的风电场群概率预测及系统优化调度方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员