Salient object detection (SOD) in remote sensing images faces significant challenges due to large variations in object sizes, the computational cost of self-attention mechanisms, and the limitations of CNN-based extractors in capturing global context and long-range dependencies. Existing methods that rely on fixed convolution kernels often struggle to adapt to diverse object scales, leading to detail loss or irrelevant feature aggregation. To address these issues, this work aims to enhance robustness to scale variations and achieve precise object localization. We propose the Region Proportion-Aware Dynamic Adaptive Salient Object Detection Network (RDNet), which replaces the CNN backbone with the SwinTransformer for global context modeling and introduces three key modules: (1) the Dynamic Adaptive Detail-aware (DAD) module, which applies varied convolution kernels guided by object region proportions; (2) the Frequency-matching Context Enhancement (FCE) module, which enriches contextual information through wavelet interactions and attention; and (3) the Region Proportion-aware Localization (RPL) module, which employs cross-attention to highlight semantic details and integrates a Proportion Guidance (PG) block to assist the DAD module. By combining these modules, RDNet achieves robustness against scale variations and accurate localization, delivering superior detection performance compared with state-of-the-art methods.


翻译:遥感图像中的显著目标检测面临显著挑战,这主要源于目标尺寸的巨大差异、自注意力机制的计算成本,以及基于CNN的提取器在捕获全局上下文和长程依赖关系方面的局限性。依赖固定卷积核的现有方法往往难以适应多样的目标尺度,导致细节丢失或不相关特征聚合。为解决这些问题,本工作旨在增强对尺度变化的鲁棒性并实现精确的目标定位。我们提出了区域比例感知的动态自适应显著目标检测网络(RDNet),它使用SwinTransformer替代CNN骨干网络以进行全局上下文建模,并引入了三个关键模块:(1) 动态自适应细节感知模块,该模块根据目标区域比例引导应用不同的卷积核;(2) 频率匹配上下文增强模块,通过小波交互和注意力机制来丰富上下文信息;(3) 区域比例感知定位模块,该模块利用交叉注意力来突出语义细节,并集成了比例引导块以辅助DAD模块。通过结合这些模块,RDNet实现了对尺度变化的鲁棒性和精确的定位能力,与最先进的方法相比,提供了更优的检测性能。

0
下载
关闭预览

相关内容

光学遥感图像目标检测数据集综述
专知会员服务
31+阅读 · 2024年3月29日
遥感影像小目标检测研究进展
专知会员服务
54+阅读 · 2023年3月17日
使用多层胶囊网络的国防军事目标检测
专知会员服务
45+阅读 · 2022年8月14日
专知会员服务
75+阅读 · 2021年3月23日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
16+阅读 · 2018年7月26日
一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD
七月在线实验室
11+阅读 · 2018年7月18日
基于深度学习的图像目标检测(下)
机器学习研究会
12+阅读 · 2018年1月1日
基于注意力机制的图卷积网络
科技创新与创业
74+阅读 · 2017年11月8日
深度学习目标检测模型全面综述:Faster R-CNN、R-FCN和SSD
深度学习世界
10+阅读 · 2017年9月18日
CNN、RNN在自动特征提取中的应用
乌镇智库
14+阅读 · 2017年8月4日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
最新内容
AutoScientists:自组织智能体团队驱动长期科学实验
战略前沿人工智能的再思考(中文)
专知会员服务
2+阅读 · 今天14:53
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
2+阅读 · 今天14:51
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
2+阅读 · 今天14:38
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
13+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关VIP内容
光学遥感图像目标检测数据集综述
专知会员服务
31+阅读 · 2024年3月29日
遥感影像小目标检测研究进展
专知会员服务
54+阅读 · 2023年3月17日
使用多层胶囊网络的国防军事目标检测
专知会员服务
45+阅读 · 2022年8月14日
专知会员服务
75+阅读 · 2021年3月23日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员