Large-scale foundation models (FMs) in remote sensing (RS) are developed based on the paradigms established in computer vision (CV) and have shown promise for various Earth observation applications. However, the direct transfer of scaling assumptions from CV to RS has not been adequately examined. We hypothesize that RS FMs enter an overparameterized regime at substantially smaller scales than their CV counterparts, where increasing parameter count primarily induces redundant representations rather than qualitatively new abstractions. To test this hypothesis, we use post-hoc slimming, where we uniformly reduce the width of pretrained encoder, as a tool to measure representational redundancy across six state-of-the-art RS FMs on four downstream classification tasks. Our findings reveal a significant contrast with those in the CV domain: while a post-hoc slimmed masked autoencoder (MAE) trained on ImageNet retains less than 10% accuracy at 1% FLOPs, RS FMs maintain over 71% relative accuracy at the same budget. This sevenfold difference provides strong empirical support for our hypothesis. We further demonstrate that learned slimmable training can improve both Momentum Contrast (MoCo)- and MAE- based models. In addition, through the explained variance ratio and the feature correlation analysis, we provide mechanistic explanations showing that RS FMs distribute task-relevant information with high redundancy. Our findings establish post-hoc slimmability as both a practical deployment strategy for resource-constrained environments and a diagnostic tool that challenges the prevailing scaling paradigm in RS. Upon acceptance, we will publish all code.


翻译:遥感领域的大规模基础模型基于计算机视觉领域建立的范式开发,已在多种地球观测应用中展现出潜力。然而,将计算机视觉的尺度假设直接迁移至遥感领域的做法尚未得到充分验证。我们假设遥感基础模型在远小于计算机视觉模型的尺度下即进入过参数化状态,此时增加参数数量主要引发冗余表征而非质变的新抽象特征。为验证该假设,我们采用后置压缩方法——均匀缩减预训练编码器的宽度——作为衡量工具,在四项下游分类任务中对六种先进遥感基础模型的表征冗余度进行测量。研究结果揭示了与计算机视觉领域的显著差异:在ImageNet上训练的后置压缩掩码自编码器在1%计算量下精度保留率不足10%,而同等计算预算下遥感基础模型的相对精度仍保持71%以上。这七倍的差异为我们的假设提供了强有力的实证支持。我们进一步证明,可压缩学习训练能够同时改进基于动量对比学习与掩码自编码器的模型。此外,通过方差解释比与特征相关性分析,我们提供了机制性解释,表明遥感基础模型以高冗余度分布任务相关信息。本研究确立后置压缩技术兼具双重价值:既是资源受限环境下的实用部署策略,也是挑战当前遥感领域主流尺度范式的诊断工具。论文录用后,我们将公开全部代码。

0
下载
关闭预览

相关内容

航天遥感大模型发展综述与产业化应用展望
专知会员服务
22+阅读 · 2025年6月26日
遥感大模型:综述与未来设想
专知会员服务
21+阅读 · 2025年4月2日
《遥感基础模型研究综述:从视觉到多模态的演进》
专知会员服务
18+阅读 · 2025年3月31日
遥感基础模型发展综述与未来设想
专知会员服务
20+阅读 · 2024年8月13日
大模型+遥感?最新《遥感中的人工智能基础模型》综述
专知会员服务
63+阅读 · 2024年8月10日
多模态遥感图像配准方法研究综述
专知会员服务
19+阅读 · 2024年7月20日
光学遥感图像目标检测数据集综述
专知会员服务
31+阅读 · 2024年3月29日
【经典书】遥感图像百科全书,957页pdf
专知会员服务
49+阅读 · 2023年3月17日
数据受限条件下的多模态处理技术综述
专知
22+阅读 · 2022年7月16日
专家报告|高光谱遥感信息提取方法
中国图象图形学报
12+阅读 · 2019年7月14日
【大数据】大数据参考架构和关键技术(综合)
产业智能官
14+阅读 · 2018年11月22日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
1+阅读 · 1月28日
VIP会员
相关VIP内容
航天遥感大模型发展综述与产业化应用展望
专知会员服务
22+阅读 · 2025年6月26日
遥感大模型:综述与未来设想
专知会员服务
21+阅读 · 2025年4月2日
《遥感基础模型研究综述:从视觉到多模态的演进》
专知会员服务
18+阅读 · 2025年3月31日
遥感基础模型发展综述与未来设想
专知会员服务
20+阅读 · 2024年8月13日
大模型+遥感?最新《遥感中的人工智能基础模型》综述
专知会员服务
63+阅读 · 2024年8月10日
多模态遥感图像配准方法研究综述
专知会员服务
19+阅读 · 2024年7月20日
光学遥感图像目标检测数据集综述
专知会员服务
31+阅读 · 2024年3月29日
【经典书】遥感图像百科全书,957页pdf
专知会员服务
49+阅读 · 2023年3月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员