Inference-Time Loss-Guided Colour Preservation in Diffusion Sampling - 专知论文

会员服务 ·

0

损失 · 感兴趣区域 · 失效 · 约束 · 潜在 ·

Inference-Time Loss-Guided Colour Preservation in Diffusion Sampling

翻译：推理时损失引导的扩散采样色彩保持方法

Angad Singh Ahuja,Aarush Ram Anandh

from arxiv, 25 Pages, 12 Figures, 3 Tables, 5 Appendices, 8 Algorithms

Precise color control remains a persistent failure mode in text-to-image diffusion systems, particularly in design-oriented workflows where outputs must satisfy explicit, user-specified color targets. We present an inference-time, region-constrained color preservation method that steers a pretrained diffusion model without any additional training. Our approach combines (i) ROI-based inpainting for spatial selectivity, (ii) background-latent re-imposition to prevent color drift outside the ROI, and (iii) latent nudging via gradient guidance using a composite loss defined in CIE Lab and linear RGB. The loss is constructed to control not only the mean ROI color but also the tail of the pixelwise error distribution through CVaR-style and soft-maximum penalties, with a late-start gate and a time-dependent schedule to stabilize guidance across denoising steps. We show that mean-only baselines can satisfy average color constraints while producing perceptually salient local failures, motivating our distribution-aware objective. The resulting method provides a practical, training-free mechanism for targeted color adherence that can be integrated into standard Stable Diffusion inpainting pipelines.

翻译：精确的色彩控制仍然是文本到图像扩散系统中持续存在的失效模式，尤其在面向设计的工作流程中，输出必须满足用户明确指定的色彩目标。我们提出一种推理时、区域约束的色彩保持方法，该方法无需任何额外训练即可引导预训练的扩散模型。我们的方法结合了：（i）基于感兴趣区域的修复以实现空间选择性；（ii）背景潜在重新施加以防止感兴趣区域外的色彩漂移；（iii）通过在CIE Lab和线性RGB空间中定义的复合损失进行梯度引导的潜在微调。该损失函数的构建不仅控制感兴趣区域的平均色彩，还通过CVaR风格和软最大值惩罚控制逐像素误差分布的尾部，并采用延迟启动门控和依赖于时间的调度策略，以在去噪步骤间稳定引导。我们证明仅使用平均值的基线方法虽然能满足平均色彩约束，但会产生感知上显著的局部失效，这促使我们采用分布感知的目标函数。最终的方法提供了一种实用的、无需训练的目标色彩遵循机制，可集成到标准的Stable Diffusion修复流程中。

0

相关内容

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

专知会员服务

14+阅读 · 2025年11月25日

用于时间序列预测的扩散模型：综述

用于时间序列预测的扩散模型：综述

专知会员服务

30+阅读 · 2025年7月22日

重新审视测试时扩展：一项综述与面向多样性的高效推理方法

重新审视测试时扩展：一项综述与面向多样性的高效推理方法

专知会员服务

10+阅读 · 2025年6月8日

基于扩散模型和流模型的推理时引导生成技术

基于扩散模型和流模型的推理时引导生成技术

专知会员服务

17+阅读 · 2025年4月30日

扩散模型如何做好可控生成？基于奖励引导的控制生成用于扩散模型中的推理时对齐：教程与综述

扩散模型如何做好可控生成？基于奖励引导的控制生成用于扩散模型中的推理时对齐：教程与综述

专知会员服务

21+阅读 · 2025年1月20日

【CVPR2024】平衡之道：扩散模型中的分布指导去偏差

【CVPR2024】平衡之道：扩散模型中的分布指导去偏差

专知会员服务

22+阅读 · 2024年3月2日

【CVPR2024】DistriFusion: 高分辨率扩散模型的分布式并行推理

【CVPR2024】DistriFusion: 高分辨率扩散模型的分布式并行推理

专知会员服务

22+阅读 · 2024年3月1日

【CVPR2024】扩散、关注、分割：使用稳定扩散进行无监督零样本分割

【CVPR2024】扩散、关注、分割：使用稳定扩散进行无监督零样本分割

专知会员服务

29+阅读 · 2024年2月27日

扩散模型图像超分辨率等综述

扩散模型图像超分辨率等综述

专知会员服务

25+阅读 · 2024年1月2日

【NeurIPS 2022】扩散模型的深度平衡方法

【NeurIPS 2022】扩散模型的深度平衡方法

专知会员服务

40+阅读 · 2022年11月5日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【ICLR2021】彩色化变换器，Colorization Transformer

【ICLR2021】彩色化变换器，Colorization Transformer

专知

12+阅读 · 2021年2月10日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

27+阅读 · 2020年7月26日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

基于多帧时空信息协同理解的自然感彩色红外成像方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于黎曼流形的彩色纹理结构张量图像分割方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多特征驱动的彩色多聚焦图像融合理论与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于几何形状的彩色纹理分析方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于对合否定的SBL公理化扩张系统的程度化推理及逻辑控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

Critic-Guided Reinforcement Unlearning in Text-to-Image Diffusion

Arxiv

0+阅读 · 2月15日

Localized Control in Diffusion Models via Latent Vector Prediction

Arxiv

0+阅读 · 2月11日

Inference-Time Alignment for Diffusion Models via Variationally Stable Doob's Matching

Arxiv

0+阅读 · 2月3日

Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer

Arxiv

0+阅读 · 2月3日

Object Fidelity Diffusion for Remote Sensing Image Generation

Arxiv

0+阅读 · 2月3日

Data-Driven Loss Functions for Inference-Time Optimization in Text-to-Image

Arxiv

0+阅读 · 2月2日

Leveraging Latent Vector Prediction for Localized Control in Image Generation via Diffusion Models

Arxiv

0+阅读 · 2月2日

Test-Time Anchoring for Discrete Diffusion Posterior Sampling

Arxiv

0+阅读 · 1月30日

ILRR: Inference-Time Steering Method for Masked Diffusion Language Models

Arxiv

0+阅读 · 1月29日

POCI-Diff: Position Objects Consistently and Interactively with 3D-Layout Guided Diffusion

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

感兴趣区域

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

【AAAI2026】《SimDiff：用于时间序列点预测的更简单但更优的扩散模型》

专知会员服务

14+阅读 · 2025年11月25日

用于时间序列预测的扩散模型：综述

用于时间序列预测的扩散模型：综述

专知会员服务

30+阅读 · 2025年7月22日

重新审视测试时扩展：一项综述与面向多样性的高效推理方法

重新审视测试时扩展：一项综述与面向多样性的高效推理方法

专知会员服务

10+阅读 · 2025年6月8日

基于扩散模型和流模型的推理时引导生成技术

基于扩散模型和流模型的推理时引导生成技术

专知会员服务

17+阅读 · 2025年4月30日

扩散模型如何做好可控生成？基于奖励引导的控制生成用于扩散模型中的推理时对齐：教程与综述

扩散模型如何做好可控生成？基于奖励引导的控制生成用于扩散模型中的推理时对齐：教程与综述

专知会员服务

21+阅读 · 2025年1月20日

【CVPR2024】平衡之道：扩散模型中的分布指导去偏差

【CVPR2024】平衡之道：扩散模型中的分布指导去偏差

专知会员服务

22+阅读 · 2024年3月2日

【CVPR2024】DistriFusion: 高分辨率扩散模型的分布式并行推理

【CVPR2024】DistriFusion: 高分辨率扩散模型的分布式并行推理

专知会员服务

22+阅读 · 2024年3月1日

【CVPR2024】扩散、关注、分割：使用稳定扩散进行无监督零样本分割

【CVPR2024】扩散、关注、分割：使用稳定扩散进行无监督零样本分割

专知会员服务

29+阅读 · 2024年2月27日

扩散模型图像超分辨率等综述

扩散模型图像超分辨率等综述

专知会员服务

25+阅读 · 2024年1月2日

【NeurIPS 2022】扩散模型的深度平衡方法

【NeurIPS 2022】扩散模型的深度平衡方法

专知会员服务

40+阅读 · 2022年11月5日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【ICLR2021】彩色化变换器，Colorization Transformer

【ICLR2021】彩色化变换器，Colorization Transformer

专知

12+阅读 · 2021年2月10日

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

【浙大博士论文】面向复杂场景理解的视觉内容识别、检测与推理方法研究

专知

27+阅读 · 2020年7月26日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

相关论文

Critic-Guided Reinforcement Unlearning in Text-to-Image Diffusion

Arxiv

0+阅读 · 2月15日

Localized Control in Diffusion Models via Latent Vector Prediction

Arxiv

0+阅读 · 2月11日

Inference-Time Alignment for Diffusion Models via Variationally Stable Doob's Matching

Arxiv

0+阅读 · 2月3日

Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer

Arxiv

0+阅读 · 2月3日

Object Fidelity Diffusion for Remote Sensing Image Generation

Arxiv

0+阅读 · 2月3日

Data-Driven Loss Functions for Inference-Time Optimization in Text-to-Image

Arxiv

0+阅读 · 2月2日

Leveraging Latent Vector Prediction for Localized Control in Image Generation via Diffusion Models

Arxiv

0+阅读 · 2月2日

Test-Time Anchoring for Discrete Diffusion Posterior Sampling

Arxiv

0+阅读 · 1月30日

ILRR: Inference-Time Steering Method for Masked Diffusion Language Models

Arxiv

0+阅读 · 1月29日

POCI-Diff: Position Objects Consistently and Interactively with 3D-Layout Guided Diffusion

Arxiv

0+阅读 · 1月20日

相关基金

基于多帧时空信息协同理解的自然感彩色红外成像方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于黎曼流形的彩色纹理结构张量图像分割方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多特征驱动的彩色多聚焦图像融合理论与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

彩色图像的高保真可逆信息隐藏算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于几何形状的彩色纹理分析方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于对合否定的SBL公理化扩张系统的程度化推理及逻辑控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员