Biotic communities vary continuously across space, yet biome maps impose categorical boundaries that compress this variation, particularly at ecotones where transitional communities are ecologically distinct. Could Earth observation (EO) foundation models, which encode spectral, spatial, and temporal information with dense embeddings, convert discrete biome maps into continuous representations that better capture ecological variation? Here, we fit a linear classifier on Clay v1.5 satellite image embeddings to predict biome labels from a categorical map. The softmax output yields a continuous probability vector whose dimensions correspond to named biome classes. We evaluate this approach using six Brazilian biomes, 1.3 million embeddings, and 10,015 withheld forest inventory plots spanning 4,672 plant species. The continuous biome representation outperforms discrete biome labels for predicting species occurrence (mean per-species AUC 0.618 vs. 0.570 across 10 spatial cross-validation folds). Decomposing this gain shows that continuity in the graded probability output, rather than label reassignment, accounts for the improvement; the pattern holds across all distances from biome boundaries. The raw 1024-dimensional embedding remains the strongest predictor we tested (mean AUC 0.646 vs. 0.618), but the continuous representation recovers most of the embedding's gain over discrete labels. This simple approach provides a probabilistic replacement for categorical map labels, preserving their meaning while encoding graded variation that discrete maps suppress.


翻译:生物群落随空间连续变化,然而生物群系地图通过设定类别边界压缩了这种变异性,尤其在生态过渡带中,过渡性群落具有独特的生态特征。地球观测基础模型(如编码光谱、时空信息的密集嵌入)能否将离散的生物群系地图转化为连续表征,从而更好地捕捉生态变异性?本文在Clay v1.5卫星图像嵌入上拟合线性分类器,基于类别地图预测生物群系标签。Softmax输出生成连续概率向量,其维度对应命名生物群系类别。我们利用巴西亚马逊的六个生物群系、130万个嵌入以及涵盖4672种植物物种的10015个保留森林样地数据进行评估。连续生物群系表征在预测物种出现方面优于离散生物群系标签(10次空间交叉验证中,每物种平均AUC值0.618 vs 0.570)。分解这一增益发现,分级概率输出的连续性(而非标签重分配)是性能提升的原因;该模式在距生物群系边界的所有距离上均成立。原始1024维嵌入仍是我们测试的最强预测因子(平均AUC 0.646 vs 0.618),但连续表征恢复了嵌入相对于离散标签的大部分增益。这种简单方法为类别地图标签提供了一种概率替代方案,既保留其含义,又编码了离散地图所抑制的分级变异。

0
下载
关闭预览

相关内容

具有动能的生命体。
面向天域感知领域的知识图谱构建技术研究
专知会员服务
55+阅读 · 2023年10月15日
Into the Metaverse,93页ppt介绍元宇宙概念、应用、趋势
专知会员服务
49+阅读 · 2022年2月19日
大数据时代的地学知识图谱研究展望
专知会员服务
34+阅读 · 2021年11月25日
知识图谱最新研究综述
深度学习自然语言处理
45+阅读 · 2020年6月14日
灾难性遗忘问题新视角:迁移-干扰平衡
CreateAMind
17+阅读 · 2019年7月6日
Elasticsearch地理信息存储及查询之Geo_Point
Analysys易观
13+阅读 · 2018年12月29日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题
开放知识图谱
26+阅读 · 2018年6月26日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
VIP会员
最新内容
《通过小型无人机系统将情报能力“作战化”》
专知会员服务
3+阅读 · 今天7:28
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
《离线语言支持系统:面向空战战术决策》
专知会员服务
8+阅读 · 6月15日
相关VIP内容
相关基金
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员