Visibility nowcasting in South Korea: a machine learning approach to class imbalance and distribution shift - 专知论文

会员服务 ·

0

能见度 · 分布偏移 · 韩国 · 类别 · 机器学习 ·

Visibility nowcasting in South Korea: a machine learning approach to class imbalance and distribution shift

翻译：韩国大气能见度临近预报：应对类别失衡与分布偏移的机器学习方法

Bong Gyun Shin,Chan Sik Lee,Hyesun Suh

from arxiv, Published in Theoretical and Applied Climatology

Atmospheric visibility is a critical variable for transportation safety and air quality management, however, accurate prediction remains challenging due to the complex interactions between meteorological conditions and air pollutants, as well as the rarity of low-visibility events. This study introduces a machine learning framework to nowcast visibility in six major South Korean cities. To handle the imbalance in the 2018-2020 training data, we applied the Synthetic Minority Over-sampling Technique with Nominal and Continuous (SMOTENC) and Conditional Tabular Generative Adversarial Network (CTGAN). An ensemble approach combining machine learning and deep learning models was then used and evaluated on a 2021 test dataset. The results revealed a marked decline in predictive performance in the test set compared to the cross-validation phase. This degradation was attributed to a distributional shift between training and testing periods, which was quantitatively confirmed by measuring the Wasserstein distance of the most influential feature identified by SHAP analysis. In general, this study presents a methodology that aims to simultaneously address the dual challenges of data imbalance and temporal distributional shifts, and emphasizes the necessity of accounting for evolving external environmental factors when implementing nowcasting models on time-series data.

翻译：大气能见度是影响交通安全和空气质量管理的核心变量，然而由于气象条件与空气污染物之间复杂的相互作用，加之低能见度事件的罕见性，其准确预测仍面临挑战。本研究提出一种机器学习框架，对韩国六大主要城市进行能见度临近预报。为处理2018-2020年训练数据中的类别失衡问题，我们应用了基于名义与连续变量的合成少数类过采样技术（SMOTENC）和条件表格生成对抗网络（CTGAN）。随后构建了融合机器学习与深度学习模型的集成方法，并在2021年测试数据集上评估其性能。结果表明，与交叉验证阶段相比，预测性能在测试集中出现显著下降。通过SHAP分析识别关键特征后，利用Wasserstein距离定量验证了训练期与测试期之间的分布偏移是导致性能退化的主要原因。整体而言，本研究提出了一种旨在同步解决数据失衡与时序分布偏移双重挑战的方法论，并强调在时间序列数据上实施临近预报模型时必须考虑外部环境因素的动态演变。

0

相关内容

能见度

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

专知会员服务

8+阅读 · 5月11日

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

25+阅读 · 2025年1月15日

【ICML2022】气候变化与机器学习:机遇、挑战与考虑，121页ppt

【ICML2022】气候变化与机器学习:机遇、挑战与考虑，121页ppt

专知会员服务

39+阅读 · 2022年7月22日

33页PPT【AI+天气预测】，AI and Machine learning for weather predictions

33页PPT【AI+天气预测】，AI and Machine learning for weather predictions

专知会员服务

35+阅读 · 2022年3月5日

67页PPT【ML+气象】使用机器学习技术对季节和次季节研究和预测，Use of Machine Learning Techniques for Seasonal and Subseasonal Studies and Predictions

67页PPT【ML+气象】使用机器学习技术对季节和次季节研究和预测，Use of Machine Learning Techniques for Seasonal and Subseasonal Studies and Predictions

专知会员服务

19+阅读 · 2022年3月4日

天气预报中的人工智能技术进展

专知会员服务

40+阅读 · 2021年8月31日

【预测天气】使用深度学习改进天气预报的进展和挑战，60页ppt，Progress and challenges for the use of deep learning to improve weather forecasts，Peter Dueben

【预测天气】使用深度学习改进天气预报的进展和挑战，60页ppt，Progress and challenges for the use of deep learning to improve weather forecasts，Peter Dueben

专知会员服务

55+阅读 · 2020年3月14日

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

专知会员服务

22+阅读 · 2020年1月15日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

55+阅读 · 2022年4月25日

AI如何促进态势感知？2022美国空军AFRL等「态势感知」万字综述论文，24也pdf阐述智能战场态势感知技术、挑战和前景

AI如何促进态势感知？2022美国空军AFRL等「态势感知」万字综述论文，24也pdf阐述智能战场态势感知技术、挑战和前景

专知

132+阅读 · 2022年3月19日

2022最新《数据与机器学习，人工智能报告》

2022最新《数据与机器学习，人工智能报告》

专知

11+阅读 · 2022年2月21日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

荐文 | 时序预测中的深度学习：以电力负载预测为例

荐文 | 时序预测中的深度学习：以电力负载预测为例

德先生

32+阅读 · 2019年9月18日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

人工智能顶刊TPAMI2019最新《多模态机器学习综述》【附21页论文下载】

人工智能顶刊TPAMI2019最新《多模态机器学习综述》【附21页论文下载】

专知

125+阅读 · 2019年1月19日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

基于隐马尔可夫模型分析不同天气模态下东亚地区近地面CO2浓度变化特征

国家自然科学基金

0+阅读 · 2015年12月31日

支持应急决策的气象灾害大数据融合的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大数据环境下公路网突发事件预警与应急决策研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于社会化网络媒体数据的城市空气质量监测方法与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

中国南北方不同高度大气冰核数浓度及核化机制对比研究

国家自然科学基金

0+阅读 · 2015年12月31日

黑河流域高时空分辨率未来气候变化情景模拟与不确定性评估

国家自然科学基金

0+阅读 · 2014年12月31日

能源效率测度和资源优化配置的非参数前沿面建模方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

基于大数据的雾霾天气情景构建与应急决策鲁棒优化方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于多层多源信息的地区级智能电网短期负荷预测研究

国家自然科学基金

2+阅读 · 2014年12月31日

Physics-Constrained Neural Networks for Improved Short-Term Weather Forecasting: A Case Study over the South Pacific

Arxiv

0+阅读 · 6月16日

Exascale Hybrid Numerical-AI Ensembles for Operational Flood-Season Forecasting in East Asia: 15-km Decadal Hindcasts and 1-km High-Resolution Capability

Arxiv

0+阅读 · 6月14日

Regional Climate Model Emulation with Diffusion Approaches: What is the Added Value of Generative Machine Learning?

Arxiv

0+阅读 · 6月12日

Uncertainty-Aware Deep Learning for Wildfire Danger Forecasting

Arxiv

0+阅读 · 6月9日

Temporal Coverage over Density: Parsimonious Training-Set Design for ML Climate Downscaling

Arxiv

0+阅读 · 6月5日

Scalable Uncertainty Quantification for Extreme Weather Forecasting via Empirical Neural Tangent Kernels

Arxiv

0+阅读 · 6月3日

AI and physics-based weather forecasting: A comparative study

Arxiv

0+阅读 · 6月1日

Exascale Hybrid Numerical-AI Ensembles for Operational Flood-Season Forecasting in East Asia: 15-km Decadal Hindcasts and 1-km High-Resolution Capability

Arxiv

0+阅读 · 5月24日

M$^2$FedAQI: Multimodal Federated Learning for Air Quality Prediction on Heterogeneous Edge Devices

Arxiv

0+阅读 · 5月10日

Graph Convolutional Support Vector Regression for Robust Spatiotemporal Forecasting of Urban Air Pollution

Arxiv

0+阅读 · 5月5日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

5+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

2+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

2+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

13+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

12+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

12+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

8+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

13+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

9+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

22+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

11+阅读 · 6月17日

相关VIP内容

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

专知会员服务

8+阅读 · 5月11日

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

25+阅读 · 2025年1月15日

【ICML2022】气候变化与机器学习:机遇、挑战与考虑，121页ppt

【ICML2022】气候变化与机器学习:机遇、挑战与考虑，121页ppt

专知会员服务

39+阅读 · 2022年7月22日

33页PPT【AI+天气预测】，AI and Machine learning for weather predictions

33页PPT【AI+天气预测】，AI and Machine learning for weather predictions

专知会员服务

35+阅读 · 2022年3月5日

67页PPT【ML+气象】使用机器学习技术对季节和次季节研究和预测，Use of Machine Learning Techniques for Seasonal and Subseasonal Studies and Predictions

67页PPT【ML+气象】使用机器学习技术对季节和次季节研究和预测，Use of Machine Learning Techniques for Seasonal and Subseasonal Studies and Predictions

专知会员服务

19+阅读 · 2022年3月4日

天气预报中的人工智能技术进展

专知会员服务

40+阅读 · 2021年8月31日

【预测天气】使用深度学习改进天气预报的进展和挑战，60页ppt，Progress and challenges for the use of deep learning to improve weather forecasts，Peter Dueben

【预测天气】使用深度学习改进天气预报的进展和挑战，60页ppt，Progress and challenges for the use of deep learning to improve weather forecasts，Peter Dueben

专知会员服务

55+阅读 · 2020年3月14日

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

专知会员服务

22+阅读 · 2020年1月15日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

55+阅读 · 2022年4月25日

AI如何促进态势感知？2022美国空军AFRL等「态势感知」万字综述论文，24也pdf阐述智能战场态势感知技术、挑战和前景

AI如何促进态势感知？2022美国空军AFRL等「态势感知」万字综述论文，24也pdf阐述智能战场态势感知技术、挑战和前景

专知

132+阅读 · 2022年3月19日

2022最新《数据与机器学习，人工智能报告》

2022最新《数据与机器学习，人工智能报告》

专知

11+阅读 · 2022年2月21日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

荐文 | 时序预测中的深度学习：以电力负载预测为例

荐文 | 时序预测中的深度学习：以电力负载预测为例

德先生

32+阅读 · 2019年9月18日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

人工智能顶刊TPAMI2019最新《多模态机器学习综述》【附21页论文下载】

人工智能顶刊TPAMI2019最新《多模态机器学习综述》【附21页论文下载】

专知

125+阅读 · 2019年1月19日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

相关论文

Physics-Constrained Neural Networks for Improved Short-Term Weather Forecasting: A Case Study over the South Pacific

Arxiv

0+阅读 · 6月16日

Exascale Hybrid Numerical-AI Ensembles for Operational Flood-Season Forecasting in East Asia: 15-km Decadal Hindcasts and 1-km High-Resolution Capability

Arxiv

0+阅读 · 6月14日

Regional Climate Model Emulation with Diffusion Approaches: What is the Added Value of Generative Machine Learning?

Arxiv

0+阅读 · 6月12日

Uncertainty-Aware Deep Learning for Wildfire Danger Forecasting

Arxiv

0+阅读 · 6月9日

Temporal Coverage over Density: Parsimonious Training-Set Design for ML Climate Downscaling

Arxiv

0+阅读 · 6月5日

Scalable Uncertainty Quantification for Extreme Weather Forecasting via Empirical Neural Tangent Kernels

Arxiv

0+阅读 · 6月3日

AI and physics-based weather forecasting: A comparative study

Arxiv

0+阅读 · 6月1日

Exascale Hybrid Numerical-AI Ensembles for Operational Flood-Season Forecasting in East Asia: 15-km Decadal Hindcasts and 1-km High-Resolution Capability

Arxiv

0+阅读 · 5月24日

M$^2$FedAQI: Multimodal Federated Learning for Air Quality Prediction on Heterogeneous Edge Devices

Arxiv

0+阅读 · 5月10日

Graph Convolutional Support Vector Regression for Robust Spatiotemporal Forecasting of Urban Air Pollution

Arxiv

0+阅读 · 5月5日

相关基金

基于隐马尔可夫模型分析不同天气模态下东亚地区近地面CO2浓度变化特征

国家自然科学基金

0+阅读 · 2015年12月31日

支持应急决策的气象灾害大数据融合的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大数据环境下公路网突发事件预警与应急决策研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于社会化网络媒体数据的城市空气质量监测方法与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

中国南北方不同高度大气冰核数浓度及核化机制对比研究

国家自然科学基金

0+阅读 · 2015年12月31日

黑河流域高时空分辨率未来气候变化情景模拟与不确定性评估

国家自然科学基金

0+阅读 · 2014年12月31日

能源效率测度和资源优化配置的非参数前沿面建模方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

基于大数据的雾霾天气情景构建与应急决策鲁棒优化方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于多层多源信息的地区级智能电网短期负荷预测研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员