Towards Efficient Low-rate Image Compression with Frequency-aware Diffusion Prior Refinement - 专知论文

会员服务 ·

0

一致 · 潜在 · 生成先验 · 码率分配 · 高保真 ·

Towards Efficient Low-rate Image Compression with Frequency-aware Diffusion Prior Refinement

翻译：面向高效低码率图像压缩的频率感知扩散先验优化

Yichong Xia,Yimin Zhou,Jinpeng Wang,Bin Chen

Recent advancements in diffusion-based generative priors have enabled visually plausible image compression at extremely low bit rates. However, existing approaches suffer from slow sampling processes and suboptimal bit allocation due to fragmented training paradigms. In this work, we propose Accelerate \textbf{Diff}usion-based Image Compression via \textbf{C}onsistency Prior \textbf{R}efinement (DiffCR), a novel compression framework for efficient and high-fidelity image reconstruction. At the heart of DiffCR is a Frequency-aware Skip Estimation (FaSE) module that refines the $ε$-prediction prior from a pre-trained latent diffusion model and aligns it with compressed latents at different timesteps via Frequency Decoupling Attention (FDA). Furthermore, a lightweight consistency estimator enables fast \textbf{two-step decoding} by preserving the semantic trajectory of diffusion sampling. Without updating the backbone diffusion model, DiffCR achieves substantial bitrate savings (27.2\% BD-rate (LPIPS) and 65.1\% BD-rate (PSNR)) and over $10\times$ speed-up compared to SOTA diffusion-based compression baselines.

翻译：基于扩散的生成先验的最新进展使得在极低码率下实现视觉可信的图像压缩成为可能。然而，现有方法因训练范式碎片化而存在采样过程缓慢和码率分配次优的问题。本文提出一种新颖的压缩框架——通过一致性先验优化加速基于扩散的图像压缩（DiffCR），以实现高效且高保真的图像重建。DiffCR的核心是一个频率感知跳跃估计（FaSE）模块，该模块对预训练潜在扩散模型的$ε$预测先验进行优化，并通过频率解耦注意力（FDA）机制将其与不同时间步的压缩潜在表示对齐。此外，一个轻量级的一致性估计器通过保持扩散采样的语义轨迹，实现了快速的**两步解码**。在不更新骨干扩散模型的情况下，与基于扩散的SOTA压缩基线相比，DiffCR实现了显著的码率节省（27.2% BD-rate (LPIPS) 和 65.1% BD-rate (PSNR)）以及超过$10\times$的加速。

0

相关内容

【ICLR2025】FREQPRIOR: 通过频率滤波高斯噪声改进视频扩散模型

【ICLR2025】FREQPRIOR: 通过频率滤波高斯噪声改进视频扩散模型

专知会员服务

10+阅读 · 2025年2月8日

【NeurIPS 2024】用于变分似然估计和图像去噪的扩散先验

【NeurIPS 2024】用于变分似然估计和图像去噪的扩散先验

专知会员服务

15+阅读 · 2024年10月26日

低层视觉中的扩散模型：综述

低层视觉中的扩散模型：综述

专知会员服务

22+阅读 · 2024年6月18日

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

专知会员服务

29+阅读 · 2023年8月7日

《用于增强压缩技术和计算机视觉应用的卷积神经网络的优化》美国空军研究实验室、戴顿大学2022最新85页论文

《用于增强压缩技术和计算机视觉应用的卷积神经网络的优化》美国空军研究实验室、戴顿大学2022最新85页论文

专知会员服务

24+阅读 · 2022年11月8日

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

专知会员服务

24+阅读 · 2022年8月2日

【CVPR2022】HerosNet:用于快照压缩成像的高光谱可解释重建和最佳采样深度网络

【CVPR2022】HerosNet:用于快照压缩成像的高光谱可解释重建和最佳采样深度网络

专知会员服务

20+阅读 · 2022年4月9日

【ICCV 2021】HCFlow：使用一个统一的框架处理图像超分辨率和图像再缩放

专知会员服务

15+阅读 · 2021年10月4日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

CVPR 2019 | 神奇的超分辨率算法DPSR：应对图像模糊降质

CVPR 2019 | 神奇的超分辨率算法DPSR：应对图像模糊降质

计算机视觉life

16+阅读 · 2019年4月25日

深度学习之视频图像压缩

深度学习之视频图像压缩

论智

13+阅读 · 2018年6月15日

使用CNN生成图像先验实现场景的盲图像去模糊

使用CNN生成图像先验实现场景的盲图像去模糊

统计学习与视觉计算组

10+阅读 · 2018年6月14日

概览CVPR 2018神经网络图像压缩领域进展

概览CVPR 2018神经网络图像压缩领域进展

论智

13+阅读 · 2018年6月13日

一文读懂图像压缩算法

一文读懂图像压缩算法

七月在线实验室

17+阅读 · 2018年5月2日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于内容分析的低复杂度高效视频编码方法

国家自然科学基金

0+阅读 · 2015年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知的信号重建快速算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于线性规划感知的压缩高光谱遥感图像快速重建

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知的高精度实时视觉跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向光学相干层析成像的三维结构化压缩感知方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于先验信息压缩感知SAR成像的信息理论限及实用算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知与稀疏信号恢复

国家自然科学基金

2+阅读 · 2014年12月31日

High-Fidelity Causal Video Diffusion Models for Real-Time Ultra-Low-Bitrate Semantic Communication

Arxiv

0+阅读 · 2月14日

ImageRAGTurbo: Towards One-step Text-to-Image Generation with Retrieval-Augmented Diffusion Models

Arxiv

0+阅读 · 2月13日

Seq2Seq2Seq: Lossless Data Compression via Discrete Latent Transformers and Reinforcement Learning

Arxiv

0+阅读 · 2月12日

Perception-based Image Denoising via Generative Compression

Arxiv

0+阅读 · 2月12日

Diffusion-based Signal Refiner for Speech Enhancement and Separation

Arxiv

0+阅读 · 2月10日

DisCa: Accelerating Video Diffusion Transformers with Distillation-Compatible Learnable Feature Caching

Arxiv

0+阅读 · 2月5日

Advances in Diffusion-Based Generative Compression

Arxiv

0+阅读 · 1月26日

Lossy Image Compression -- A Frequent Sequence Mining perspective employing efficient Clustering

Arxiv

0+阅读 · 1月24日

Saliency Driven Imagery Preprocessing for Efficient Compression -- Industrial Paper

Arxiv

0+阅读 · 1月24日

Efficient Camera-Controlled Video Generation of Static Scenes via Sparse Diffusion and 3D Rendering

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

最新内容

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

专知会员服务

1+阅读 · 44分钟前

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

专知会员服务

1+阅读 · 48分钟前

《无人机革命：来自俄乌战场的启示》（报告）

《无人机革命：来自俄乌战场的启示》（报告）

专知会员服务

2+阅读 · 54分钟前

《实现联合作战能力所需的技术》58页报告

《实现联合作战能力所需的技术》58页报告

专知会员服务

1+阅读 · 今天6:30

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

专知会员服务

1+阅读 · 今天6:22

以色列运用人工智能优化空袭警报系统

以色列运用人工智能优化空袭警报系统

专知会员服务

0+阅读 · 今天6:20

以色列在多条战线部署AI智能体

以色列在多条战线部署AI智能体

专知会员服务

1+阅读 · 今天6:12

《将形式化方法工具应用于电子战代码库（经验报告）》

《将形式化方法工具应用于电子战代码库（经验报告）》

专知会员服务

1+阅读 · 今天6:09

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

13+阅读 · 4月25日

多智能体协作机制

多智能体协作机制

专知会员服务

12+阅读 · 4月25日

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

9+阅读 · 4月25日

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

19+阅读 · 4月25日

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

8+阅读 · 4月25日

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

12+阅读 · 4月25日

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

9+阅读 · 4月24日

相关VIP内容

【ICLR2025】FREQPRIOR: 通过频率滤波高斯噪声改进视频扩散模型

【ICLR2025】FREQPRIOR: 通过频率滤波高斯噪声改进视频扩散模型

专知会员服务

10+阅读 · 2025年2月8日

【NeurIPS 2024】用于变分似然估计和图像去噪的扩散先验

【NeurIPS 2024】用于变分似然估计和图像去噪的扩散先验

专知会员服务

15+阅读 · 2024年10月26日

低层视觉中的扩散模型：综述

低层视觉中的扩散模型：综述

专知会员服务

22+阅读 · 2024年6月18日

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

专知会员服务

29+阅读 · 2023年8月7日

《用于增强压缩技术和计算机视觉应用的卷积神经网络的优化》美国空军研究实验室、戴顿大学2022最新85页论文

《用于增强压缩技术和计算机视觉应用的卷积神经网络的优化》美国空军研究实验室、戴顿大学2022最新85页论文

专知会员服务

24+阅读 · 2022年11月8日

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

【TPAMI2022】TransCL：基于Transformer的压缩学习，更灵活更强大

专知会员服务

24+阅读 · 2022年8月2日

【CVPR2022】HerosNet:用于快照压缩成像的高光谱可解释重建和最佳采样深度网络

【CVPR2022】HerosNet:用于快照压缩成像的高光谱可解释重建和最佳采样深度网络

专知会员服务

20+阅读 · 2022年4月9日

【ICCV 2021】HCFlow：使用一个统一的框架处理图像超分辨率和图像再缩放

专知会员服务

15+阅读 · 2021年10月4日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

《实现联合作战能力所需的技术》58页报告

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

《无人机革命：来自俄乌战场的启示》（报告）

相关资讯

CVPR 2019 | 神奇的超分辨率算法DPSR：应对图像模糊降质

CVPR 2019 | 神奇的超分辨率算法DPSR：应对图像模糊降质

计算机视觉life

16+阅读 · 2019年4月25日

深度学习之视频图像压缩

深度学习之视频图像压缩

论智

13+阅读 · 2018年6月15日

使用CNN生成图像先验实现场景的盲图像去模糊

使用CNN生成图像先验实现场景的盲图像去模糊

统计学习与视觉计算组

10+阅读 · 2018年6月14日

概览CVPR 2018神经网络图像压缩领域进展

概览CVPR 2018神经网络图像压缩领域进展

论智

13+阅读 · 2018年6月13日

一文读懂图像压缩算法

一文读懂图像压缩算法

七月在线实验室

17+阅读 · 2018年5月2日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

相关论文

High-Fidelity Causal Video Diffusion Models for Real-Time Ultra-Low-Bitrate Semantic Communication

Arxiv

0+阅读 · 2月14日

ImageRAGTurbo: Towards One-step Text-to-Image Generation with Retrieval-Augmented Diffusion Models

Arxiv

0+阅读 · 2月13日

Seq2Seq2Seq: Lossless Data Compression via Discrete Latent Transformers and Reinforcement Learning

Arxiv

0+阅读 · 2月12日

Perception-based Image Denoising via Generative Compression

Arxiv

0+阅读 · 2月12日

Diffusion-based Signal Refiner for Speech Enhancement and Separation

Arxiv

0+阅读 · 2月10日

DisCa: Accelerating Video Diffusion Transformers with Distillation-Compatible Learnable Feature Caching

Arxiv

0+阅读 · 2月5日

Advances in Diffusion-Based Generative Compression

Arxiv

0+阅读 · 1月26日

Lossy Image Compression -- A Frequent Sequence Mining perspective employing efficient Clustering

Arxiv

0+阅读 · 1月24日

Saliency Driven Imagery Preprocessing for Efficient Compression -- Industrial Paper

Arxiv

0+阅读 · 1月24日

Efficient Camera-Controlled Video Generation of Static Scenes via Sparse Diffusion and 3D Rendering

Arxiv

0+阅读 · 1月14日

相关基金

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于内容分析的低复杂度高效视频编码方法

国家自然科学基金

0+阅读 · 2015年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知的信号重建快速算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于线性规划感知的压缩高光谱遥感图像快速重建

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知的高精度实时视觉跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向光学相干层析成像的三维结构化压缩感知方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于先验信息压缩感知SAR成像的信息理论限及实用算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知与稀疏信号恢复

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员