迈向数据驱动天气模型的机制理解：内部激活揭示可解释的物理特征 (Towards mechanistic understanding in a data-driven weather model: internal activations reveal interpretable physical features) - 专知论文

会员服务 ·

0

数据驱动 · 工具 · 物理模型 · 一致 · 稀疏 ·

2025 年 12 月 30 日

Towards mechanistic understanding in a data-driven weather model: internal activations reveal interpretable physical features

翻译：迈向数据驱动天气模型的机制理解：内部激活揭示可解释的物理特征

Theodore MacMillan,Nicholas T. Ouellette

from arxiv, 18 pages, 13 figures

Large data-driven physics models like DeepMind's weather model GraphCast have empirically succeeded in parameterizing time operators for complex dynamical systems with an accuracy reaching or in some cases exceeding that of traditional physics-based solvers. Unfortunately, how these data-driven models perform computations is largely unknown and whether their internal representations are interpretable or physically consistent is an open question. Here, we adapt tools from interpretability research in Large Language Models to analyze intermediate computational layers in GraphCast, leveraging sparse autoencoders to discover interpretable features in the neuron space of the model. We uncover distinct features on a wide range of length and time scales that correspond to tropical cyclones, atmospheric rivers, diurnal and seasonal behavior, large-scale precipitation patterns, specific geographical coding, and sea-ice extent, among others. We further demonstrate how the precise abstraction of these features can be probed via interventions on the prediction steps of the model. As a case study, we sparsely modify a feature corresponding to tropical cyclones in GraphCast and observe interpretable and physically consistent modifications to evolving hurricanes. Such methods offer a window into the black-box behavior of data-driven physics models and are a step towards realizing their potential as trustworthy predictors and scientifically valuable tools for discovery.

翻译：诸如DeepMind天气模型GraphCast等大型数据驱动的物理模型，已在经验上成功实现了对复杂动力系统时间算子的参数化，其精度达到甚至在某些情况下超越了传统基于物理的求解器。然而，这些数据驱动的模型如何进行计算在很大程度上仍是未知的，其内部表征是否可解释或具有物理一致性也是一个悬而未决的问题。在此，我们借鉴大型语言模型可解释性研究中的工具，通过利用稀疏自编码器在模型的神经元空间中发现可解释特征，来分析GraphCast中的中间计算层。我们发现了跨越广泛时空尺度的多种特征，分别对应于热带气旋、大气河流、昼夜与季节行为、大尺度降水模式、特定的地理编码以及海冰范围等。我们进一步展示了如何通过对模型预测步骤进行干预，来探究这些特征的精确抽象。作为案例研究，我们稀疏地修改了GraphCast中一个对应于热带气旋的特征，并观察到对发展中的飓风产生的可解释且物理一致的修改。此类方法为窥探数据驱动物理模型的黑箱行为提供了一扇窗口，是朝着实现其作为可信赖的预测工具及具有科学价值的发现工具的潜力迈出的一步。

0

相关内容

数据驱动

通过采集数据（这里的数据必须满足大、全、细、时），将数据进行组织形成信息流，在做决策或者产品、运营等优化时，根据不同需求对信息流进行提炼总结，从而在数据的支撑下或者指导下进行科学的行动叫做数据驱动。

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

24+阅读 · 2025年1月15日

CVPR2024最新《从高维数据中学习深度低维模型：从理论到实践》教程

CVPR2024最新《从高维数据中学习深度低维模型：从理论到实践》教程

专知会员服务

45+阅读 · 2024年6月19日

动态数据驱动仿真综述

动态数据驱动仿真综述

专知会员服务

52+阅读 · 2024年5月17日

大模型时代的自动图表理解综述

大模型时代的自动图表理解综述

专知会员服务

70+阅读 · 2024年3月19日

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

专知会员服务

49+阅读 · 2023年12月9日

可解释的机器学习模型和架构

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日

深度预测学习：模型与应用

深度预测学习：模型与应用

专知会员服务

49+阅读 · 2022年12月5日

《数据驱动的科学与工程——机器学习、动力系统与控制》，572页pdf

《数据驱动的科学与工程——机器学习、动力系统与控制》，572页pdf

专知会员服务

199+阅读 · 2021年2月17日

机器学习的可解释性

机器学习的可解释性

专知会员服务

179+阅读 · 2020年8月27日

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

36+阅读 · 2022年1月8日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

【干货】让遥感图像活起来：遥感图像描述生成的模型与数据集探索

【干货】让遥感图像活起来：遥感图像描述生成的模型与数据集探索

专知

24+阅读 · 2018年1月2日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

面向浅水波大气动力方程求解器的可重构计算方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于控制器动态线性化的数据驱动控制方法及在精馏过程的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于粒计算的大数据特征融合理论与方法

国家自然科学基金

8+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

信息物理系统动力学演化融合机制与行为建模研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

Interpretability in Deep Time Series Models Demands Semantic Alignment

Arxiv

0+阅读 · 2月2日

Comparing and Contrasting DLWP Backbones on Navier-Stokes and Atmospheric Dynamics

Arxiv

0+阅读 · 1月30日

Physics-Guided Multimodal Transformers are the Necessary Foundation for the Next Generation of Meteorological Science

Arxiv

0+阅读 · 1月28日

Interpretable Air Pollution Forecasting by Physics-Guided Spatiotemporal Decoupling

Arxiv

0+阅读 · 1月22日

Efficient Parameter Calibration of Numerical Weather Prediction Models via Evolutionary Sequential Transfer Optimization

Arxiv

0+阅读 · 1月21日

Data-driven stochastic reduced-order modeling of parametrized dynamical systems

Arxiv

0+阅读 · 1月15日

Physically Plausible Multi-System Trajectory Generation and Symmetry Discovery

Arxiv

0+阅读 · 1月14日

MAD: Motion Appearance Decoupling for efficient Driving World Models

Arxiv

0+阅读 · 1月14日

ClimateIQA: A New Dataset and Benchmark to Advance Vision-Language Models in Meteorology Anomalies Analysis

Arxiv

0+阅读 · 1月13日

Data-driven particle dynamics: Structure-preserving coarse-graining for emergent behavior in non-equilibrium systems

Arxiv

0+阅读 · 2025年12月29日

VIP会员

文章信息

相关主题

相关VIP内容

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

24+阅读 · 2025年1月15日

CVPR2024最新《从高维数据中学习深度低维模型：从理论到实践》教程

CVPR2024最新《从高维数据中学习深度低维模型：从理论到实践》教程

专知会员服务

45+阅读 · 2024年6月19日

动态数据驱动仿真综述

动态数据驱动仿真综述

专知会员服务

52+阅读 · 2024年5月17日

大模型时代的自动图表理解综述

大模型时代的自动图表理解综述

专知会员服务

70+阅读 · 2024年3月19日

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

大模型如何预测天气？悉尼科技大学等最新《天气和气候数据理解的基础模型》综述

专知会员服务

49+阅读 · 2023年12月9日

可解释的机器学习模型和架构

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日

深度预测学习：模型与应用

深度预测学习：模型与应用

专知会员服务

49+阅读 · 2022年12月5日

《数据驱动的科学与工程——机器学习、动力系统与控制》，572页pdf

《数据驱动的科学与工程——机器学习、动力系统与控制》，572页pdf

专知会员服务

199+阅读 · 2021年2月17日

机器学习的可解释性

机器学习的可解释性

专知会员服务

179+阅读 · 2020年8月27日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【干货书】《机器学习动力系统与控制》，572页pdf

【干货书】《机器学习动力系统与控制》，572页pdf

专知

36+阅读 · 2022年1月8日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

77+阅读 · 2019年10月20日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

【干货】让遥感图像活起来：遥感图像描述生成的模型与数据集探索

【干货】让遥感图像活起来：遥感图像描述生成的模型与数据集探索

专知

24+阅读 · 2018年1月2日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Interpretability in Deep Time Series Models Demands Semantic Alignment

Arxiv

0+阅读 · 2月2日

Comparing and Contrasting DLWP Backbones on Navier-Stokes and Atmospheric Dynamics

Arxiv

0+阅读 · 1月30日

Physics-Guided Multimodal Transformers are the Necessary Foundation for the Next Generation of Meteorological Science

Arxiv

0+阅读 · 1月28日

Interpretable Air Pollution Forecasting by Physics-Guided Spatiotemporal Decoupling

Arxiv

0+阅读 · 1月22日

Efficient Parameter Calibration of Numerical Weather Prediction Models via Evolutionary Sequential Transfer Optimization

Arxiv

0+阅读 · 1月21日

Data-driven stochastic reduced-order modeling of parametrized dynamical systems

Arxiv

0+阅读 · 1月15日

Physically Plausible Multi-System Trajectory Generation and Symmetry Discovery

Arxiv

0+阅读 · 1月14日

MAD: Motion Appearance Decoupling for efficient Driving World Models

Arxiv

0+阅读 · 1月14日

ClimateIQA: A New Dataset and Benchmark to Advance Vision-Language Models in Meteorology Anomalies Analysis

Arxiv

0+阅读 · 1月13日

Data-driven particle dynamics: Structure-preserving coarse-graining for emergent behavior in non-equilibrium systems

Arxiv

0+阅读 · 2025年12月29日

相关基金

面向浅水波大气动力方程求解器的可重构计算方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于控制器动态线性化的数据驱动控制方法及在精馏过程的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于粒计算的大数据特征融合理论与方法

国家自然科学基金

8+阅读 · 2015年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

面向地理模型集成与运行的数据适配方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

信息物理系统动力学演化融合机制与行为建模研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员