Remote sensing (RS) change detection methods can extract critical information on surface dynamics and are an essential means for humans to understand changes in the earth's surface and environment. Among these methods, semantic change detection (SCD) can more effectively interpret the multi-class information contained in bi-temporal RS imagery, providing semantic-level predictions that support dynamic change monitoring. However, due to the limited semantic understanding capability of the model and the inherent complexity of the SCD tasks, existing SCD methods face significant challenges in both performance and paradigm complexity. In this paper, we propose PerASCD, a SCD method driven by RS foundation model PerA, designed to enhance the multi-scale semantic understanding and overall performance. We introduce a modular Cascaded Gated Decoder (CG-Decoder) that simplifies complex SCD decoding pipelines while promoting effective multi-level feature interaction and fusion. In addition, we propose a Soft Semantic Consistency Loss (SSCLoss) to mitigate the numerical instability commonly encountered during SCD training. We further explore the applicability of multiple existing RS foundation models on the SCD task when equipped with the proposed decoder. Experimental results demonstrate that our decoder not only effectively simplifies the paradigm of SCD, but also achieves seamless adaptation across various vision encoders. Our method achieves state-of-the-art (SOTA) performance on two public benchmark datasets, validating its effectiveness. The code is available at https://github.com/SathShen/PerASCD.git.


翻译:遥感变化检测方法能够提取地表动态的关键信息,是人类理解地表与环境变化的重要手段。其中,语义变化检测能够更有效地解读双时相遥感图像中包含的多类别信息,提供支持动态变化监测的语义级预测。然而,由于模型语义理解能力的局限以及语义变化检测任务固有的复杂性,现有方法在性能与范式复杂度方面均面临显著挑战。本文提出PerASCD,一种由遥感基础模型PerA驱动的语义变化检测方法,旨在增强多尺度语义理解与整体性能。我们引入了一种模块化的级联门控解码器,该解码器在简化复杂语义变化检测解码流程的同时,促进了有效的多层次特征交互与融合。此外,我们提出了软语义一致性损失函数,以缓解语义变化检测训练中常见的数值不稳定问题。我们进一步探究了多种现有遥感基础模型在配备所提解码器时对语义变化检测任务的适用性。实验结果表明,我们的解码器不仅能有效简化语义变化检测的范式,还能实现跨多种视觉编码器的无缝适配。我们的方法在两个公开基准数据集上取得了最先进的性能,验证了其有效性。代码发布于 https://github.com/SathShen/PerASCD.git。

0
下载
关闭预览

相关内容

《遥感基础模型研究综述:从视觉到多模态的演进》
专知会员服务
18+阅读 · 2025年3月31日
《遥感时序视觉语言模型》全面综述
专知会员服务
30+阅读 · 2024年12月4日
遥感基础模型发展综述与未来设想
专知会员服务
20+阅读 · 2024年8月13日
大模型+遥感?最新《遥感中的人工智能基础模型》综述
专知会员服务
63+阅读 · 2024年8月10日
光学遥感图像目标检测数据集综述
专知会员服务
31+阅读 · 2024年3月29日
基于图注意力机制和Transformer的异常检测
专知会员服务
62+阅读 · 2022年5月16日
用户画像基础
DataFunTalk
12+阅读 · 2020年8月1日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD
七月在线实验室
11+阅读 · 2018年7月18日
深度学习时代的目标检测算法
炼数成金订阅号
40+阅读 · 2018年3月19日
实战|手把手教你实现图象边缘检测!
全球人工智能
10+阅读 · 2018年1月19日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月16日
VIP会员
相关VIP内容
《遥感基础模型研究综述:从视觉到多模态的演进》
专知会员服务
18+阅读 · 2025年3月31日
《遥感时序视觉语言模型》全面综述
专知会员服务
30+阅读 · 2024年12月4日
遥感基础模型发展综述与未来设想
专知会员服务
20+阅读 · 2024年8月13日
大模型+遥感?最新《遥感中的人工智能基础模型》综述
专知会员服务
63+阅读 · 2024年8月10日
光学遥感图像目标检测数据集综述
专知会员服务
31+阅读 · 2024年3月29日
基于图注意力机制和Transformer的异常检测
专知会员服务
62+阅读 · 2022年5月16日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员