We present the RAW domain diffusion model (RDDM), an end-to-end diffusion model that restores photo-realistic images directly from the sensor RAW data. While recent sRGB-domain diffusion methods achieve impressive results, they are caught in a dilemma between high fidelity and image generation. These models process lossy sRGB inputs and neglect the accessibility of the sensor RAW images in many scenarios, e.g., in image and video capturing in edge devices, resulting in sub-optimal performance. RDDM obviates this limitation by directly restoring images in the RAW domain, replacing the conventional two-stage image signal processing (ISP)->Image Restoration (IR) pipeline. However, a simple adaptation of pre-trained diffusion models to the RAW domain confronts many challenges. To this end, we propose: (1) a RAW-domain VAE (RVAE), encoding sensor RAW and decoding it into an enhanced linear domain image, to solve the out-of-distribution (OOD) issues between the different domain distributions; (2) a configurable multi-bayer (CMB) LoRA module, adapting diverse RAW Bayer patterns such as RGGB, BGGR, etc. To compensate for the deficiency in the dataset, we develop a scalable data synthesis pipeline synthesizing RAW LQ-HQ pairs from existing sRGB datasets for large-scale training. Extensive experiments demonstrate RDDM's superiority over state-of-the-art sRGB diffusion methods, yielding higher fidelity results with fewer artifacts. Codes will be publicly available at https://github.com/YanCHEN-fr/RDDM.


翻译:本文提出RAW域扩散模型(RDDM),一种可直接从传感器RAW数据中复原照片级真实感图像的端到端扩散模型。尽管近期sRGB域扩散方法取得了令人瞩目的成果,但其在高保真度与图像生成之间陷入两难境地。这些模型处理有损的sRGB输入,且忽视了传感器RAW图像在许多场景(如边缘设备中的图像与视频采集)中的可获取性,导致性能未能达到最优。RDDM通过直接在RAW域进行图像复原,取代了传统的图像信号处理(ISP)→图像复原(IR)两阶段流程,从而克服了这一局限。然而,将预训练扩散模型简单适配至RAW域面临诸多挑战。为此,我们提出:(1)RAW域变分自编码器(RVAE),通过编码传感器RAW数据并将其解码至增强的线性域图像,以解决不同域分布间的分布外(OOD)问题;(2)可配置多拜耳(CMB)LoRA模块,适配RGGB、BGGR等多种RAW拜耳阵列模式。为弥补数据集的不足,我们开发了可扩展的数据合成流程,从现有sRGB数据集中合成RAW低质量-高质量配对数据以进行大规模训练。大量实验表明,RDDM优于当前最先进的sRGB扩散方法,能以更少的伪影产生更高保真度的结果。代码将在https://github.com/YanCHEN-fr/RDDM 公开提供。

0
下载
关闭预览

相关内容

图像复原(image restoration)即利用退化过程的先验知识,去恢复已被退化图像的本来面目。图像复原技术主要是针对成像过程中的“退化”而提出来的,而成像过程中的“退化”现象主要指成像系统受到各种因素的影响,诸如成像系统的散焦、设备与物体间存在相对运动或者是器材的固有缺陷等,导致图像的质量不能够达到理想要求。
面向低光照图像增强的扩散模型
专知会员服务
15+阅读 · 2025年10月11日
扩散模型图像超分辨率等综述
专知会员服务
25+阅读 · 2024年1月2日
中科大等最新《基于扩散模型的图像恢复和增强》综述
专知会员服务
37+阅读 · 2023年8月22日
Deep Image Prior——图像恢复入门
中国人工智能学会
15+阅读 · 2019年2月16日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
16+阅读 · 2018年7月26日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
面向低光照图像增强的扩散模型
专知会员服务
15+阅读 · 2025年10月11日
扩散模型图像超分辨率等综述
专知会员服务
25+阅读 · 2024年1月2日
中科大等最新《基于扩散模型的图像恢复和增强》综述
专知会员服务
37+阅读 · 2023年8月22日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员