We introduce FLUXtrapolation, a benchmark for extrapolating ecosystem fluxes under progressively harder distribution shifts. Ecosystem fluxes are central to understanding the carbon, water, and energy cycles, yet they can only be measured directly at sparsely located measurement towers. Producing global flux estimates therefore requires training models on observed sites using globally available covariates and predicting in unobserved regions, that is, upscaling. Flux upscaling is a challenging domain generalization problem that is affected by a shift in covariate distribution across climates, ecosystem types, and environmental conditions, as well as by conditional shift: important drivers remain unobserved at global scale. We provide a quantitative analysis of both these shifts in $P_X$ and $P_{Y\mid X}$. FLUXtrapolation is designed based on domain expertise on flux upscaling: it defines temporal, spatial, and temperature-based extrapolation scenarios and evaluates performance across held-out domains, temporal aggregations, and tail errors. In a pilot study, we find that baselines perform similarly under median hourly RMSE, but separate under the proposed tail-focused and multi-scale evaluation. FLUXtrapolation therefore poses a realistic and thus relevant challenge for machine learning methods under distribution shift; at the same time, progress on this benchmark would directly support the scientific goal of improving flux upscaling.


翻译:我们提出了FLUXtrapolation,一个用于在逐渐增强的分布偏移下外推生态系统通量的基准测试。生态系统通量对于理解碳、水及能量循环至关重要,但仅能通过稀疏分布的观测塔直接测量。因此,生成全球通量估算需要利用全球可用的协变量在观测站点上训练模型,并预测未观测区域的结果,即尺度上推。通量尺度上推是一个具有挑战性的领域泛化问题,既受跨气候、生态系统类型及环境条件的协变量分布偏移影响,也受条件偏移影响:关键驱动因子在全球尺度上仍未被观测到。我们对$P_X$和$P_{Y\mid X}$中的这两种偏移进行了定量分析。FLUXtrapolation基于通量尺度上推的领域专业知识设计:它定义了时间、空间和基于温度的外推场景,并在留出域、时间聚合及尾部误差上评估性能。在初步研究中,我们发现基线方法在中位数小时均方根误差上表现相似,但在所提出的尾部聚焦和多尺度评估中表现分化。因此,FLUXtrapolation为分布偏移下的机器学习方法提出了一个现实且相关的挑战;同时,该基准的进展将直接支持改进通量尺度上推的科学目标。

0
下载
关闭预览

相关内容

基于注意力机制的态势要素推荐技术
专知会员服务
27+阅读 · 2025年2月14日
多模态遥感图像配准方法研究综述
专知会员服务
19+阅读 · 2024年7月20日
【NeurIPS2020】基于能量的分布外检测
专知会员服务
14+阅读 · 2020年10月10日
论文浅尝 - CIKM2020 | 用于推荐系统的多模态知识图谱
开放知识图谱
12+阅读 · 2020年12月17日
CVPR 2020 论文大盘点-光流篇
计算机视觉life
10+阅读 · 2020年7月17日
推荐系统(一):推荐系统基础
菜鸟的机器学习
25+阅读 · 2019年9月2日
learn to see in the dark-低照度图像增强算法
计算机视觉life
16+阅读 · 2019年1月14日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员