SALAD-Pan: Sensor-Agnostic Latent Adaptive Diffusion for Pan-Sharpening - 专知论文

会员服务 ·

0

传感 · 传感器 · 全色锐化 · 潜在 · 多光谱 ·

SALAD-Pan: Sensor-Agnostic Latent Adaptive Diffusion for Pan-Sharpening

翻译：SALAD-Pan：用于全色锐化的传感器无关潜在自适应扩散方法

Junjie Li,Congyang Ou,Haokui Zhang,Guoting Wei,Shengqin Jiang,Ying Li,Chunhua Shen

Recently, diffusion models bring novel insights for Pan-sharpening and notably boost fusion precision. However, most existing models perform diffusion in the pixel space and train distinct models for different multispectral (MS) imagery, suffering from high latency and sensor-specific limitations. In this paper, we present SALAD-Pan, a sensor-agnostic latent space diffusion method for efficient pansharpening. Specifically, SALAD-Pan trains a band-wise single-channel VAE to encode high-resolution multispectral (HRMS) into compact latent representations, supporting MS images with various channel counts and establishing a basis for acceleration. Then spectral physical properties, along with PAN and MS images, are injected into the diffusion backbone through unidirectional and bidirectional interactive control structures respectively, achieving high-precision fusion in the diffusion process. Finally, a lightweight cross-spectral attention module is added to the central layer of diffusion model, reinforcing spectral connections to boost spectral consistency and further elevate fusion precision. Experimental results on GaoFen-2, QuickBird, and WorldView-3 demonstrate that SALAD-Pan outperforms state-of-the-art diffusion-based methods across all three datasets, attains a 2-3x inference speedup, and exhibits robust zero-shot (cross-sensor) capability.

翻译：近年来，扩散模型为全色锐化带来了新的思路，并显著提升了融合精度。然而，现有模型大多在像素空间进行扩散，且需为不同的多光谱影像训练独立模型，存在高延迟和传感器特定限制的问题。本文提出SALAD-Pan，一种传感器无关的潜在空间扩散方法，用于高效的全色锐化。具体而言，SALAD-Pan训练一个波段式单通道变分自编码器，将高分辨率多光谱影像编码为紧凑的潜在表示，支持不同通道数的多光谱图像，并为加速奠定基础。随后，光谱物理特性与全色及多光谱图像分别通过单向和双向交互控制结构注入扩散主干网络，在扩散过程中实现高精度融合。最后，在扩散模型的核心层引入轻量级跨光谱注意力模块，以增强光谱关联性，提升光谱一致性并进一步提高融合精度。在高分二号、QuickBird和WorldView-3数据集上的实验结果表明，SALAD-Pan在三个数据集上均优于当前最先进的基于扩散的方法，推理速度提升2-3倍，并展现出鲁棒的零样本（跨传感器）能力。

0

相关内容

面向低光照图像增强的扩散模型

面向低光照图像增强的扩散模型

专知会员服务

15+阅读 · 2025年10月11日

医学影像中的高效扩散模型：全面综述

医学影像中的高效扩散模型：全面综述

专知会员服务

15+阅读 · 2025年5月26日

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

专知会员服务

23+阅读 · 2025年2月5日

【ICLR2025】CUBEDIFF：将基于扩散的图像模型重新用于全景生成

【ICLR2025】CUBEDIFF：将基于扩散的图像模型重新用于全景生成

专知会员服务

12+阅读 · 2025年1月29日

LargeAD：面向自动驾驶的大规模跨传感器数据预训练

LargeAD：面向自动驾驶的大规模跨传感器数据预训练

专知会员服务

17+阅读 · 2025年1月8日

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

专知会员服务

69+阅读 · 2024年3月9日

爆火Sora背后的技术，UC伯克利最新《扩散模型》课程视频，210页ppt

爆火Sora背后的技术，UC伯克利最新《扩散模型》课程视频，210页ppt

专知会员服务

103+阅读 · 2024年2月25日

扩散模型图像超分辨率等综述

扩散模型图像超分辨率等综述

专知会员服务

25+阅读 · 2024年1月2日

领域自适应在实际中如何用? UNC最新《无源无监督领域自适应SFUDA》综述论文，详述白盒SFUDA和黑盒SFUDA技术进展

领域自适应在实际中如何用? UNC最新《无源无监督领域自适应SFUDA》综述论文，详述白盒SFUDA和黑盒SFUDA技术进展

专知会员服务

23+阅读 · 2023年1月6日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

CVer

17+阅读 · 2020年7月10日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

机器之心

18+阅读 · 2019年6月12日

关于GANs在医学图像领域应用的总结

关于GANs在医学图像领域应用的总结

人工智能前沿讲习班

31+阅读 · 2019年6月4日

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

专知

32+阅读 · 2018年8月14日

基于几何特征的激光雷达地面点云分割

基于几何特征的激光雷达地面点云分割

泡泡机器人SLAM

15+阅读 · 2018年4月1日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

机器之心

12+阅读 · 2017年11月7日

基于深度信念网络的高光谱遥感影像变化检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于有限元方法的反应扩散种群模型斑图数值模拟研究

国家自然科学基金

0+阅读 · 2015年12月31日

高功率光纤激光反常受激拉曼散射机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的高分辨率PolSAR影像暗目标判别

国家自然科学基金

3+阅读 · 2015年12月31日

全极化SAR遥感图像中相干斑滤波机理及方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂海面多波段全极化雷达后向散射机理模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于模型的无波前传感器自适应光学关键理论和方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高分辨率单极化SAR图像慢动船只散射特性稳健高层表征研究

国家自然科学基金

1+阅读 · 2015年12月31日

高分辨率宽测绘带合成孔径激光雷达技术的研究

国家自然科学基金

1+阅读 · 2014年12月31日

合成孔径雷达（SAR）在地球科学应用中的尺度效应研究

国家自然科学基金

0+阅读 · 2014年12月31日

PAND: Prompt-Aware Neighborhood Distillation for Lightweight Fine-Grained Visual Classification

PAND: Prompt-Aware Neighborhood Distillation for Lightweight Fine-Grained Visual Classification

Arxiv

0+阅读 · 3月18日

Fillerbuster: Unified Generative Scene Completion Model for Casual Captures

Arxiv

0+阅读 · 3月16日

Pansharpening for Thin-Cloud Contaminated Remote Sensing Images: A Unified Framework and Benchmark Dataset

Arxiv

0+阅读 · 3月16日

SALAD: Self-Adaptive Link Adaptation

Arxiv

0+阅读 · 3月13日

SenCache: Accelerating Diffusion Model Inference via Sensitivity-Aware Caching

Arxiv

0+阅读 · 2月27日

DriftLite: Lightweight Drift Control for Inference-Time Scaling of Diffusion Models

Arxiv

0+阅读 · 2月21日

S2WMamba: A Spectral-Spatial Wavelet Mamba for Pansharpening

Arxiv

0+阅读 · 2月15日

SAR-RAG: ATR Visual Question Answering by Semantic Search, Retrieval, and MLLM Generation

Arxiv

0+阅读 · 2月4日

SalFormer360: a transformer-based saliency estimation model for 360-degree videos

Arxiv

0+阅读 · 2月4日

PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

0+阅读 · 4月23日

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

0+阅读 · 4月23日

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

3+阅读 · 4月23日

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

5+阅读 · 4月23日

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

2+阅读 · 4月23日

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

10+阅读 · 4月23日

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

4+阅读 · 4月23日

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

6+阅读 · 4月23日

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 4月23日

《基于Transformer的异常舰船导航识别与跟踪》80页

《基于Transformer的异常舰船导航识别与跟踪》80页

专知会员服务

8+阅读 · 4月23日

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

专知会员服务

6+阅读 · 4月23日

《低数据领域军事目标检测模型研究》

《低数据领域军事目标检测模型研究》

专知会员服务

6+阅读 · 4月23日

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

专知会员服务

6+阅读 · 4月23日

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

10+阅读 · 4月22日

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

18+阅读 · 4月22日

相关VIP内容

面向低光照图像增强的扩散模型

面向低光照图像增强的扩散模型

专知会员服务

15+阅读 · 2025年10月11日

医学影像中的高效扩散模型：全面综述

医学影像中的高效扩散模型：全面综述

专知会员服务

15+阅读 · 2025年5月26日

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

多分辨率SAR与光学遥感影像配准方法：综述、数据集与未来展望

专知会员服务

23+阅读 · 2025年2月5日

【ICLR2025】CUBEDIFF：将基于扩散的图像模型重新用于全景生成

【ICLR2025】CUBEDIFF：将基于扩散的图像模型重新用于全景生成

专知会员服务

12+阅读 · 2025年1月29日

LargeAD：面向自动驾驶的大规模跨传感器数据预训练

LargeAD：面向自动驾驶的大规模跨传感器数据预训练

专知会员服务

17+阅读 · 2025年1月8日

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

专知会员服务

69+阅读 · 2024年3月9日

爆火Sora背后的技术，UC伯克利最新《扩散模型》课程视频，210页ppt

爆火Sora背后的技术，UC伯克利最新《扩散模型》课程视频，210页ppt

专知会员服务

103+阅读 · 2024年2月25日

扩散模型图像超分辨率等综述

扩散模型图像超分辨率等综述

专知会员服务

25+阅读 · 2024年1月2日

领域自适应在实际中如何用? UNC最新《无源无监督领域自适应SFUDA》综述论文，详述白盒SFUDA和黑盒SFUDA技术进展

领域自适应在实际中如何用? UNC最新《无源无监督领域自适应SFUDA》综述论文，详述白盒SFUDA和黑盒SFUDA技术进展

专知会员服务

23+阅读 · 2023年1月6日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体长期记忆安全性综述：迈向记忆主权

人工智能赋能无人机：俄乌战争（万字长文）

【斯坦福博士论文】语言模型的机械可解释性与控制

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

相关资讯

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

CVer

17+阅读 · 2020年7月10日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

机器之心

18+阅读 · 2019年6月12日

关于GANs在医学图像领域应用的总结

关于GANs在医学图像领域应用的总结

人工智能前沿讲习班

31+阅读 · 2019年6月4日

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

专知

32+阅读 · 2018年8月14日

基于几何特征的激光雷达地面点云分割

基于几何特征的激光雷达地面点云分割

泡泡机器人SLAM

15+阅读 · 2018年4月1日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

机器之心

12+阅读 · 2017年11月7日

相关论文

PAND: Prompt-Aware Neighborhood Distillation for Lightweight Fine-Grained Visual Classification

PAND: Prompt-Aware Neighborhood Distillation for Lightweight Fine-Grained Visual Classification

Arxiv

0+阅读 · 3月18日

Fillerbuster: Unified Generative Scene Completion Model for Casual Captures

Arxiv

0+阅读 · 3月16日

Pansharpening for Thin-Cloud Contaminated Remote Sensing Images: A Unified Framework and Benchmark Dataset

Arxiv

0+阅读 · 3月16日

SALAD: Self-Adaptive Link Adaptation

Arxiv

0+阅读 · 3月13日

SenCache: Accelerating Diffusion Model Inference via Sensitivity-Aware Caching

Arxiv

0+阅读 · 2月27日

DriftLite: Lightweight Drift Control for Inference-Time Scaling of Diffusion Models

Arxiv

0+阅读 · 2月21日

S2WMamba: A Spectral-Spatial Wavelet Mamba for Pansharpening

Arxiv

0+阅读 · 2月15日

SAR-RAG: ATR Visual Question Answering by Semantic Search, Retrieval, and MLLM Generation

Arxiv

0+阅读 · 2月4日

SalFormer360: a transformer-based saliency estimation model for 360-degree videos

Arxiv

0+阅读 · 2月4日

PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss

Arxiv

0+阅读 · 2月2日

相关基金

基于深度信念网络的高光谱遥感影像变化检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于有限元方法的反应扩散种群模型斑图数值模拟研究

国家自然科学基金

0+阅读 · 2015年12月31日

高功率光纤激光反常受激拉曼散射机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的高分辨率PolSAR影像暗目标判别

国家自然科学基金

3+阅读 · 2015年12月31日

全极化SAR遥感图像中相干斑滤波机理及方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂海面多波段全极化雷达后向散射机理模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于模型的无波前传感器自适应光学关键理论和方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高分辨率单极化SAR图像慢动船只散射特性稳健高层表征研究

国家自然科学基金

1+阅读 · 2015年12月31日

高分辨率宽测绘带合成孔径激光雷达技术的研究

国家自然科学基金

1+阅读 · 2014年12月31日

合成孔径雷达（SAR）在地球科学应用中的尺度效应研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员