Learning A Physical-aware Diffusion Model Based on Transformer for Underwater Image Enhancement - 专知论文

会员服务 ·

0

水下 · 图像增强 · 水下图像增强 · 扩散过程 · 知识 ·

Learning A Physical-aware Diffusion Model Based on Transformer for Underwater Image Enhancement

翻译：基于Transformer的物理感知扩散模型用于水下图像增强

Chen Zhao,Chenyu Dong,Weiling Cai,Yueyue Wang

from arxiv, IEEE Transactions on Geoscience and Remote Sensing (TGRS)

Underwater visuals undergo various complex degradations, inevitably influencing the efficiency of underwater vision tasks. Recently, diffusion models were employed to underwater image enhancement (UIE) tasks, and gained SOTA performance. However, these methods fail to consider the physical properties and underwater imaging mechanisms in the diffusion process, limiting information completion capacity of diffusion models. In this paper, we introduce a novel UIE framework, named PA-Diff, designed to exploiting the knowledge of physics to guide the diffusion process. PA-Diff consists of Physics Prior Generation (PPG) Branch, Implicit Neural Reconstruction (INR) Branch, and Physics-aware Diffusion Transformer (PDT) Branch. Our designed PPG branch aims to produce the prior knowledge of physics. With utilizing the physics prior knowledge to guide the diffusion process, PDT branch can obtain underwater-aware ability and model the complex distribution in real-world underwater scenes. INR Branch can learn robust feature representations from diverse underwater image via implicit neural representation, which reduces the difficulty of restoration for PDT branch. Extensive experiments prove that our method achieves best performance on UIE tasks.

翻译：水下视觉图像经历多种复杂退化，不可避免地影响水下视觉任务的效率。近期，扩散模型被应用于水下图像增强任务，并取得了最先进的性能。然而，这些方法在扩散过程中未能考虑物理特性与水下成像机制，限制了扩散模型的信息补全能力。本文提出一种新颖的水下图像增强框架PA-Diff，旨在利用物理知识引导扩散过程。PA-Diff由物理先验生成分支、隐式神经重建分支和物理感知扩散Transformer分支构成。我们设计的物理先验生成分支旨在生成物理先验知识。通过利用物理先验知识引导扩散过程，物理感知扩散Transformer分支能够获得水下感知能力，并对真实水下场景中的复杂分布进行建模。隐式神经重建分支可通过隐式神经表示从多样化水下图像中学习鲁棒的特征表示，从而降低物理感知扩散Transformer分支的复原难度。大量实验证明，本方法在水下图像增强任务中取得了最佳性能。

0

相关内容

面向低光照图像增强的扩散模型

面向低光照图像增强的扩散模型

专知会员服务

17+阅读 · 2025年10月11日

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

专知会员服务

59+阅读 · 2025年7月20日

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

专知会员服务

11+阅读 · 2025年7月5日

水下图像增强与复原技术进展与展望

水下图像增强与复原技术进展与展望

专知会员服务

15+阅读 · 2024年9月5日

低层视觉中的扩散模型：综述

低层视觉中的扩散模型：综述

专知会员服务

22+阅读 · 2024年6月18日

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

专知会员服务

84+阅读 · 2023年11月3日

中科大等最新《基于扩散模型的图像恢复和增强》综述

中科大等最新《基于扩散模型的图像恢复和增强》综述

专知会员服务

37+阅读 · 2023年8月22日

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

专知会员服务

87+阅读 · 2022年10月9日

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

专知会员服务

87+阅读 · 2022年9月13日

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

专知会员服务

155+阅读 · 2022年9月5日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【DeepMind】CrossTransformers: 空间感知的小样本迁移

【DeepMind】CrossTransformers: 空间感知的小样本迁移

专知

37+阅读 · 2020年7月26日

专家报告 | 融合数据先验知识的智能图像增强

专家报告 | 融合数据先验知识的智能图像增强

中国图象图形学报

16+阅读 · 2020年5月25日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

learn to see in the dark-低照度图像增强算法

learn to see in the dark-低照度图像增强算法

计算机视觉life

16+阅读 · 2019年1月14日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

迁移学习在深度学习中的应用

迁移学习在深度学习中的应用

专知

24+阅读 · 2017年12月24日

曲面上图像处理的非局部变分模型与算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

水下鬼成像技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

后向散斑记忆水下目标激光远距离成像的理论与实验研究

国家自然科学基金

0+阅读 · 2015年12月31日

仿复眼视觉系统光谱-偏振敏感机制的水下目标检测方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂介质中地下水污染物反常扩散分数阶模型构建研究：基于等待时间外势依赖随机游走理论

国家自然科学基金

0+阅读 · 2015年12月31日

复杂海面多波段全极化雷达后向散射机理模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

海洋湍流对激光传输特性和光学成像的影响

国家自然科学基金

0+阅读 · 2014年12月31日

MV-Adapter: Enhancing Underwater Instance Segmentation via Adaptive Channel Attention

Arxiv

0+阅读 · 3月1日

Latent-Augmented Discrete Diffusion Models

Arxiv

0+阅读 · 2月24日

ImageRAGTurbo: Towards One-step Text-to-Image Generation with Retrieval-Augmented Diffusion Models

Arxiv

0+阅读 · 2月13日

Deformation-Recovery Diffusion Model (DRDM): Instance Deformation for Image Manipulation and Synthesis

Arxiv

0+阅读 · 2月11日

Enhancing Underwater Images via Adaptive Semantic-aware Codebook Learning

Arxiv

0+阅读 · 2月11日

Survey of Video Diffusion Models: Foundations, Implementations, and Applications

Arxiv

0+阅读 · 2月10日

Image-to-Image Translation with Diffusion Transformers and CLIP-Based Image Conditioning

Arxiv

0+阅读 · 2月5日

Sparse-to-Sparse Training of Diffusion Models

Arxiv

0+阅读 · 2月4日

PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss

Arxiv

0+阅读 · 2月2日

Leveraging Latent Vector Prediction for Localized Control in Image Generation via Diffusion Models

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

水下图像增强

最新内容

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

0+阅读 · 今天15:20

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

0+阅读 · 今天15:18

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

8+阅读 · 今天5:53

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

4+阅读 · 今天5:45

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

2+阅读 · 今天5:23

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

2+阅读 · 今天5:11

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

6+阅读 · 今天5:04

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

4+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

8+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

10+阅读 · 7月26日

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

专知会员服务

8+阅读 · 7月26日

《反无人机交战场景下的战斗归零研究》

《反无人机交战场景下的战斗归零研究》

专知会员服务

7+阅读 · 7月26日

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

专知会员服务

4+阅读 · 7月26日

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

5+阅读 · 7月25日

相关VIP内容

面向低光照图像增强的扩散模型

面向低光照图像增强的扩散模型

专知会员服务

17+阅读 · 2025年10月11日

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

如何理解扩散模型？ICML2025最新《利用扩散模型中的低维性：从理论到实践》。300页ppt

专知会员服务

59+阅读 · 2025年7月20日

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

专知会员服务

11+阅读 · 2025年7月5日

水下图像增强与复原技术进展与展望

水下图像增强与复原技术进展与展望

专知会员服务

15+阅读 · 2024年9月5日

低层视觉中的扩散模型：综述

低层视觉中的扩散模型：综述

专知会员服务

22+阅读 · 2024年6月18日

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

专知会员服务

84+阅读 · 2023年11月3日

中科大等最新《基于扩散模型的图像恢复和增强》综述

中科大等最新《基于扩散模型的图像恢复和增强》综述

专知会员服务

37+阅读 · 2023年8月22日

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

详解扩散模型：从DDPM到稳定扩散，附Slides与视频

专知会员服务

87+阅读 · 2022年10月9日

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

专知会员服务

87+阅读 · 2022年9月13日

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

最近大火的“扩散模型”首篇综述来了！北大最新《扩散模型:方法和应用》综述，23页pdf涵盖200页文献

专知会员服务

155+阅读 · 2022年9月5日

热门VIP内容

开通专知VIP会员享更多权益服务

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

美空军新型反无人机部队初探

博士论文 | 面向大模型推理的内存高效算法

《无人系统互操作性导论——无人系统联合架构（JAUS）》

相关资讯

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【DeepMind】CrossTransformers: 空间感知的小样本迁移

【DeepMind】CrossTransformers: 空间感知的小样本迁移

专知

37+阅读 · 2020年7月26日

专家报告 | 融合数据先验知识的智能图像增强

专家报告 | 融合数据先验知识的智能图像增强

中国图象图形学报

16+阅读 · 2020年5月25日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

learn to see in the dark-低照度图像增强算法

learn to see in the dark-低照度图像增强算法

计算机视觉life

16+阅读 · 2019年1月14日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

迁移学习在深度学习中的应用

迁移学习在深度学习中的应用

专知

24+阅读 · 2017年12月24日

相关论文

MV-Adapter: Enhancing Underwater Instance Segmentation via Adaptive Channel Attention

Arxiv

0+阅读 · 3月1日

Latent-Augmented Discrete Diffusion Models

Arxiv

0+阅读 · 2月24日

ImageRAGTurbo: Towards One-step Text-to-Image Generation with Retrieval-Augmented Diffusion Models

Arxiv

0+阅读 · 2月13日

Deformation-Recovery Diffusion Model (DRDM): Instance Deformation for Image Manipulation and Synthesis

Arxiv

0+阅读 · 2月11日

Enhancing Underwater Images via Adaptive Semantic-aware Codebook Learning

Arxiv

0+阅读 · 2月11日

Survey of Video Diffusion Models: Foundations, Implementations, and Applications

Arxiv

0+阅读 · 2月10日

Image-to-Image Translation with Diffusion Transformers and CLIP-Based Image Conditioning

Arxiv

0+阅读 · 2月5日

Sparse-to-Sparse Training of Diffusion Models

Arxiv

0+阅读 · 2月4日

PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss

Arxiv

0+阅读 · 2月2日

Leveraging Latent Vector Prediction for Localized Control in Image Generation via Diffusion Models

Arxiv

0+阅读 · 2月2日

相关基金

曲面上图像处理的非局部变分模型与算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

水下鬼成像技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

后向散斑记忆水下目标激光远距离成像的理论与实验研究

国家自然科学基金

0+阅读 · 2015年12月31日

仿复眼视觉系统光谱-偏振敏感机制的水下目标检测方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂介质中地下水污染物反常扩散分数阶模型构建研究：基于等待时间外势依赖随机游走理论

国家自然科学基金

0+阅读 · 2015年12月31日

复杂海面多波段全极化雷达后向散射机理模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

海洋湍流对激光传输特性和光学成像的影响

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员