We introduce a simple yet effective technique for estimating lighting from a single low-dynamic-range (LDR) image by reframing the task as a chrome ball inpainting problem. This approach leverages a pre-trained diffusion model, Stable Diffusion XL, to overcome the generalization failures of existing methods that rely on limited HDR panorama datasets. While conceptually simple, the task remains challenging because diffusion models often insert incorrect or inconsistent content and cannot readily generate chrome balls in HDR format. Our analysis reveals that the inpainting process is highly sensitive to the initial noise in the diffusion process, occasionally resulting in unrealistic outputs. To address this, we first introduce DiffusionLight, which uses iterative inpainting to compute a median chrome ball from multiple outputs to serve as a stable, low-frequency lighting prior that guides the generation of a high-quality final result. To generate high-dynamic-range (HDR) light probes, an Exposure LoRA is fine-tuned to create LDR images at multiple exposure values, which are then merged. While effective, DiffusionLight is time-intensive, requiring approximately 30 minutes per estimation. To reduce this overhead, we introduce DiffusionLight-Turbo, which reduces the runtime to about 30 seconds with minimal quality loss. This 60x speedup is achieved by training a Turbo LoRA to directly predict the averaged chrome balls from the iterative process. Inference is further streamlined into a single denoising pass using a LoRA swapping technique. Experimental results that show our method produces convincing light estimates across diverse settings and demonstrates superior generalization to in-the-wild scenarios. Our code is available at https://diffusionlight.github.io/turbo


翻译:本文提出了一种简单而有效的技术,通过将任务重新定义为镀铬球修复问题,从单张低动态范围(LDR)图像中估计光照。该方法利用预训练的扩散模型Stable Diffusion XL,克服了现有方法因依赖有限的高动态范围(HDR)全景数据集而产生的泛化失败问题。尽管概念简单,该任务仍具挑战性,因为扩散模型常会插入错误或不一致的内容,且难以直接生成HDR格式的镀铬球。我们的分析表明,修复过程对扩散过程中的初始噪声高度敏感,偶尔会产生不真实的输出。为解决此问题,我们首先提出了DiffusionLight,它使用迭代修复从多个输出中计算中值镀铬球,以作为稳定、低频的光照先验,指导生成高质量最终结果。为生成高动态范围(HDR)光照探针,我们微调了一个Exposure LoRA来创建多个曝光值下的LDR图像,随后将其合并。尽管有效,DiffusionLight耗时较长,每次估计约需30分钟。为降低此开销,我们引入了DiffusionLight-Turbo,将运行时间缩短至约30秒,且质量损失最小。这一60倍的加速是通过训练一个Turbo LoRA直接预测迭代过程中的平均镀铬球实现的。利用LoRA交换技术,推理过程进一步简化为单次去噪步骤。实验结果表明,我们的方法能在多样场景中生成可信的光照估计,并展现出对真实场景的卓越泛化能力。代码发布于https://diffusionlight.github.io/turbo。

0
下载
关闭预览

相关内容

面向低光照图像增强的扩散模型
专知会员服务
15+阅读 · 2025年10月11日
《深度学习HDR成像》综述论文
专知会员服务
28+阅读 · 2021年12月14日
最新《 深度学习时代的低光图像增强》综述论文,
专知会员服务
38+阅读 · 2021年4月30日
CVPR 2020 论文大盘点-光流篇
计算机视觉life
10+阅读 · 2020年7月17日
learn to see in the dark-低照度图像增强算法
计算机视觉life
16+阅读 · 2019年1月14日
DeOldify:用GAN为黑白照片重新着色
论智
34+阅读 · 2018年11月2日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
以色列军事技术对美国军力发展的持续性赋能
专知会员服务
1+阅读 · 50分钟前
《深度强化学习在兵棋推演中的应用》40页报告
专知会员服务
6+阅读 · 今天5:37
《多域作战面临复杂现实》
专知会员服务
5+阅读 · 今天5:35
《印度的多域作战:条令与能力发展》报告
专知会员服务
2+阅读 · 今天5:24
人工智能赋能无人机:俄乌战争(万字长文)
专知会员服务
6+阅读 · 4月23日
国外海军作战管理系统与作战训练系统
专知会员服务
3+阅读 · 4月23日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员