Data fusion models are widely used in air quality monitoring to integrate in situ and large-scale gridded products, offering spatially complete and temporally detailed estimates. However, traditional Gaussian-based models often underestimate extreme pollution values, leading to biased risk assessments. To address this, we present a Bayesian hierarchical data fusion framework rooted in extreme value theory, using the Dirac-delta generalised Pareto distribution to jointly account for threshold and non-threshold exceedances while preserving the timing of exceedance and non-exceedance episodes. Our model is used to describe and predict censored threshold exceedances of PM2.5 pollution in the Greater London region by using CAMS atmospheric composition reanalysis, and in situ observation stations from the automatic urban and rural network (AURN) run by the UK government. Key features of our approach include combining data with varying spatio-temporal resolutions and fully accounting for parameter uncertainties. Results show that our model outperforms Gaussian-based alternatives and standalone reanalysis data in predicting threshold exceedances at the majority of observation sites and can even result in improved spatial patterns of PM2.5 pollution than those discernible from the background data. Moreover, our approach captures greater variability and spatial patterns, such as higher PM2.5 concentrations near coastal areas, which are not evident in the reanalysis data alone.


翻译:数据融合模型广泛应用于空气质量监测中,用于整合原位观测与大尺度网格化产品,提供空间完整且时间精细的估计。然而,传统基于高斯过程的模型往往低估极端污染值,导致风险评估出现偏差。为此,我们提出一个基于极值理论的贝叶斯层次数据融合框架,利用狄拉克-德尔塔广义帕累托分布联合处理阈值超标与未超标事件,同时保留超标与非超标时段的时间连续性。该模型被用于描述和预测大伦敦地区PM2.5污染中截断阈值超标事件,采用CAMS大气成分再分析数据以及英国政府自动城市与农村监测网络(AURN)的原位观测站数据。本方法的关键特点包括融合不同时空分辨率的数据,并充分量化参数不确定性。结果表明,在多数观测站点上,该模型在预测阈值超标方面优于基于高斯过程的替代模型及单独再分析数据,甚至能揭示出比背景数据更清晰的PM2.5污染空间格局。此外,我们的方法捕捉到了更大的变异性和空间模式,例如沿海区域出现的较高PM2.5浓度,而这些在单独再分析数据中并不明显。

0
下载
关闭预览

相关内容

基于深度学习的数据融合方法研究综述
专知会员服务
147+阅读 · 2020年12月10日
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
302+阅读 · 2020年6月16日
时空数据挖掘:综述
专知
36+阅读 · 2022年6月30日
基于深度学习的数据融合方法研究综述
专知
37+阅读 · 2020年12月10日
Cassandra 在时空数据上的探索
DataFunTalk
12+阅读 · 2020年1月9日
讲堂|郑宇:多源数据融合与时空数据挖掘(下)
微软研究院AI头条
18+阅读 · 2017年4月18日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月10日
Arxiv
14+阅读 · 2023年9月27日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
基于深度学习的数据融合方法研究综述
专知会员服务
147+阅读 · 2020年12月10日
最新《深度多模态数据分析》综述论文,26页pdf
专知会员服务
302+阅读 · 2020年6月16日
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员