Edge-Aware Image Manipulation via Diffusion Models with a Novel Structure-Preservation Loss - 专知论文

会员服务 ·

0

结构 · 损失 · SPL · 边缘 · 潜在 ·

Edge-Aware Image Manipulation via Diffusion Models with a Novel Structure-Preservation Loss

翻译：基于边缘感知的图像操作：一种具有新型结构保持损失的扩散模型方法

Minsu Gong,Nuri Ryu,Jungseul Ok,Sunghyun Cho

from arxiv, Accepted to WACV 2026

Recent advances in image editing leverage latent diffusion models (LDMs) for versatile, text-prompt-driven edits across diverse tasks. Yet, maintaining pixel-level edge structures-crucial for tasks such as photorealistic style transfer or image tone adjustment-remains as a challenge for latent-diffusion-based editing. To overcome this limitation, we propose a novel Structure Preservation Loss (SPL) that leverages local linear models to quantify structural differences between input and edited images. Our training-free approach integrates SPL directly into the diffusion model's generative process to ensure structural fidelity. This core mechanism is complemented by a post-processing step to mitigate LDM decoding distortions, a masking strategy for precise edit localization, and a color preservation loss to preserve hues in unedited areas. Experiments confirm SPL enhances structural fidelity, delivering state-of-the-art performance in latent-diffusion-based image editing. Our code will be publicly released at https://github.com/gongms00/SPL.

翻译：近年来，图像编辑领域利用潜在扩散模型（LDMs）实现了跨多种任务的、由文本提示驱动的多功能编辑。然而，对于基于潜在扩散的编辑方法而言，保持像素级的边缘结构——这对于诸如照片级真实感风格迁移或图像色调调整等任务至关重要——仍然是一个挑战。为克服这一限制，我们提出了一种新颖的结构保持损失（SPL），该损失利用局部线性模型来量化输入图像与编辑后图像之间的结构差异。我们的免训练方法将SPL直接集成到扩散模型的生成过程中，以确保结构保真度。这一核心机制辅以一个后处理步骤以减轻LDM解码失真、一种用于精确定位编辑区域的掩码策略，以及一个用于保留未编辑区域色调的颜色保持损失。实验证实SPL增强了结构保真度，在基于潜在扩散的图像编辑中实现了最先进的性能。我们的代码将在 https://github.com/gongms00/SPL 公开。

0

相关内容

面向低光照图像增强的扩散模型

面向低光照图像增强的扩散模型

专知会员服务

15+阅读 · 2025年10月11日

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

专知会员服务

11+阅读 · 2025年7月5日

高效扩散模型综述

高效扩散模型综述

专知会员服务

34+阅读 · 2025年2月1日

低层视觉中的扩散模型：综述

低层视觉中的扩散模型：综述

专知会员服务

22+阅读 · 2024年6月18日

《扩散模型图像编辑》综述

《扩散模型图像编辑》综述

专知会员服务

28+阅读 · 2024年2月28日

扩散模型图像超分辨率等综述

扩散模型图像超分辨率等综述

专知会员服务

25+阅读 · 2024年1月2日

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

专知会员服务

54+阅读 · 2023年12月15日

【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型

【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型

专知会员服务

22+阅读 · 2022年12月5日

视觉的有效扩散模型综述

视觉的有效扩散模型综述

专知会员服务

97+阅读 · 2022年10月20日

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

专知会员服务

20+阅读 · 2020年1月26日

基于关系网络的视觉建模：有望替代卷积神经网络

基于关系网络的视觉建模：有望替代卷积神经网络

微软研究院AI头条

10+阅读 · 2019年7月12日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

【边缘计算】边缘计算面临的问题

【边缘计算】边缘计算面临的问题

产业智能官

17+阅读 · 2019年5月31日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

实战｜手把手教你实现图象边缘检测！

实战｜手把手教你实现图象边缘检测！

全球人工智能

10+阅读 · 2018年1月19日

图像降噪算法介绍及实现汇总

图像降噪算法介绍及实现汇总

极市平台

26+阅读 · 2018年1月3日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

边缘计算：万物互联时代新型计算模型

边缘计算：万物互联时代新型计算模型

计算机研究与发展

15+阅读 · 2017年5月19日

曲面上图像处理的非局部变分模型与算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于主动轮廓模型的海洋航空遥感图像的边缘检测模型和最优化策略研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

保持结构的交互式图像及视频编辑方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

图像修补中结构矩阵的预处理方法与理论

国家自然科学基金

1+阅读 · 2015年12月31日

PuYun-LDM: A Latent Diffusion Model for High-Resolution Ensemble Weather Forecasts

Arxiv

0+阅读 · 2月13日

Deformation-Recovery Diffusion Model (DRDM): Instance Deformation for Image Manipulation and Synthesis

Arxiv

0+阅读 · 2月11日

Localized Control in Diffusion Models via Latent Vector Prediction

Arxiv

0+阅读 · 2月11日

SnapGen++: Unleashing Diffusion Transformers for Efficient High-Fidelity Image Generation on Edge Devices

Arxiv

0+阅读 · 2月11日

XTransfer: Modality-Agnostic Few-Shot Model Transfer for Human Sensing at the Edge

Arxiv

0+阅读 · 2月6日

PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss

Arxiv

0+阅读 · 2月2日

Leveraging Latent Vector Prediction for Localized Control in Image Generation via Diffusion Models

Arxiv

0+阅读 · 2月2日

Adaptive Edge Learning for Density-Aware Graph Generation

Arxiv

0+阅读 · 1月30日

Creative Image Generation with Diffusion Model

Arxiv

0+阅读 · 1月29日

SnapGen++: Unleashing Diffusion Transformers for Efficient High-Fidelity Image Generation on Edge Devices

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

最新内容

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

3+阅读 · 今天3:12

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

4+阅读 · 今天3:00

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

2+阅读 · 今天2:56

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

2+阅读 · 今天2:44

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

4+阅读 · 今天2:37

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

专知会员服务

3+阅读 · 今天2:22

美海军“超配项目”

美海军“超配项目”

专知会员服务

4+阅读 · 今天2:13

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

10+阅读 · 4月21日

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

13+阅读 · 4月21日

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

7+阅读 · 4月21日

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

8+阅读 · 4月21日

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

10+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

相关VIP内容

面向低光照图像增强的扩散模型

面向低光照图像增强的扩散模型

专知会员服务

15+阅读 · 2025年10月11日

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

专知会员服务

11+阅读 · 2025年7月5日

高效扩散模型综述

高效扩散模型综述

专知会员服务

34+阅读 · 2025年2月1日

低层视觉中的扩散模型：综述

低层视觉中的扩散模型：综述

专知会员服务

22+阅读 · 2024年6月18日

《扩散模型图像编辑》综述

《扩散模型图像编辑》综述

专知会员服务

28+阅读 · 2024年2月28日

扩散模型图像超分辨率等综述

扩散模型图像超分辨率等综述

专知会员服务

25+阅读 · 2024年1月2日

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

【NeurIPS 2023教程】隐扩散模型:生成式AI革命正在隐空间中发生吗?，133页ppt

专知会员服务

54+阅读 · 2023年12月15日

【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型

【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型

专知会员服务

22+阅读 · 2022年12月5日

视觉的有效扩散模型综述

视觉的有效扩散模型综述

专知会员服务

97+阅读 · 2022年10月20日

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

专知会员服务

20+阅读 · 2020年1月26日

热门VIP内容

开通专知VIP会员享更多权益服务

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

大语言模型平台在国防情报应用中的对比

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

相关资讯

基于关系网络的视觉建模：有望替代卷积神经网络

基于关系网络的视觉建模：有望替代卷积神经网络

微软研究院AI头条

10+阅读 · 2019年7月12日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

【边缘计算】边缘计算面临的问题

【边缘计算】边缘计算面临的问题

产业智能官

17+阅读 · 2019年5月31日

如何设计基于深度学习的图像压缩算法

如何设计基于深度学习的图像压缩算法

论智

41+阅读 · 2018年4月26日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

实战｜手把手教你实现图象边缘检测！

实战｜手把手教你实现图象边缘检测！

全球人工智能

10+阅读 · 2018年1月19日

图像降噪算法介绍及实现汇总

图像降噪算法介绍及实现汇总

极市平台

26+阅读 · 2018年1月3日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

边缘计算：万物互联时代新型计算模型

边缘计算：万物互联时代新型计算模型

计算机研究与发展

15+阅读 · 2017年5月19日

相关论文

PuYun-LDM: A Latent Diffusion Model for High-Resolution Ensemble Weather Forecasts

Arxiv

0+阅读 · 2月13日

Deformation-Recovery Diffusion Model (DRDM): Instance Deformation for Image Manipulation and Synthesis

Arxiv

0+阅读 · 2月11日

Localized Control in Diffusion Models via Latent Vector Prediction

Arxiv

0+阅读 · 2月11日

SnapGen++: Unleashing Diffusion Transformers for Efficient High-Fidelity Image Generation on Edge Devices

Arxiv

0+阅读 · 2月11日

XTransfer: Modality-Agnostic Few-Shot Model Transfer for Human Sensing at the Edge

Arxiv

0+阅读 · 2月6日

PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss

Arxiv

0+阅读 · 2月2日

Leveraging Latent Vector Prediction for Localized Control in Image Generation via Diffusion Models

Arxiv

0+阅读 · 2月2日

Adaptive Edge Learning for Density-Aware Graph Generation

Arxiv

0+阅读 · 1月30日

Creative Image Generation with Diffusion Model

Arxiv

0+阅读 · 1月29日

SnapGen++: Unleashing Diffusion Transformers for Efficient High-Fidelity Image Generation on Edge Devices

Arxiv

0+阅读 · 1月13日

相关基金

曲面上图像处理的非局部变分模型与算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于主动轮廓模型的海洋航空遥感图像的边缘检测模型和最优化策略研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

保持结构的交互式图像及视频编辑方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

图像修补中结构矩阵的预处理方法与理论

国家自然科学基金

1+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员