LightMover: Generative Light Movement with Color and Intensity Controls - 专知论文

会员服务 ·

0

令牌 · 序列 · 源位置 · 一致 · 可控 ·

LightMover: Generative Light Movement with Color and Intensity Controls

翻译：LightMover：具备颜色与强度控制的生成式光照移动框架

Gengze Zhou,Tianyu Wang,Soo Ye Kim,Zhixin Shu,Xin Yu,Yannick Hold-Geoffroy,Sumit Chaturvedi,Qi Wu,Zhe Lin,Scott Cohen

from arxiv, CVPR 2026. 10 pages, 5 figures, 6 tables in main paper; supplementary material included

We present LightMover, a framework for controllable light manipulation in single images that leverages video diffusion priors to produce physically plausible illumination changes without re-rendering the scene. We formulate light editing as a sequence-to-sequence prediction problem in visual token space: given an image and light-control tokens, the model adjusts light position, color, and intensity together with resulting reflections, shadows, and falloff from a single view. This unified treatment of spatial (movement) and appearance (color, intensity) controls improves both manipulation and illumination understanding. We further introduce an adaptive token-pruning mechanism that preserves spatially informative tokens while compactly encoding non-spatial attributes, reducing control sequence length by 41% while maintaining editing fidelity. To train our framework, we construct a scalable rendering pipeline that generates large numbers of image pairs across varied light positions, colors, and intensities while keeping the scene content consistent with the original image. LightMover enables precise, independent control over light position, color, and intensity, and achieves high PSNR and strong semantic consistency (DINO, CLIP) across different tasks.

翻译：我们提出LightMover框架，用于单张图像中可控的光照编辑，该框架利用视频扩散先验在不重新渲染场景的前提下生成物理合理的照度变化。我们将光照编辑建模为视觉令牌空间中的序列到序列预测问题：给定图像与光照控制令牌，模型从单一视角同步调整光源位置、颜色和强度，及其产生的反射、阴影和衰减效果。这种对空间（移动）和外观（颜色和强度）控制的统一处理提升了操作精度与光照理解能力。我们进一步引入自适应令牌剪枝机制，保留空间信息丰富的令牌同时紧凑编码非空间属性，在维持编辑保真度的前提下将控制序列长度缩减41%。为训练该框架，我们构建了一个可扩展的渲染流水线，在保持场景内容与原图一致的前提下，生成大量覆盖不同光源位置、颜色及强度的图像对。LightMover能够对光源位置、颜色和强度实现精确的独立控制，并在多类任务中取得高PSNR值及强语义一致性（DINO、CLIP）。

0

相关内容

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

16+阅读 · 2月20日

面向低光照图像增强的扩散模型

面向低光照图像增强的扩散模型

专知会员服务

16+阅读 · 2025年10月11日

【ICCV2025】FlowSeek：借助深度基础模型与运动基实现更简易的光流估计

【ICCV2025】FlowSeek：借助深度基础模型与运动基实现更简易的光流估计

专知会员服务

9+阅读 · 2025年9月8日

用GPT-4实现可控文本图像生成，UC伯克利&微软提出新框架Control-GPT

用GPT-4实现可控文本图像生成，UC伯克利&微软提出新框架Control-GPT

专知会员服务

35+阅读 · 2023年6月3日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

专知会员服务

67+阅读 · 2022年7月8日

最新LightGBM进展介绍报告，39页ppt

最新LightGBM进展介绍报告，39页ppt

专知会员服务

31+阅读 · 2021年1月15日

替换Transformer！谷歌提出 Performer 模型，全面提升注意力机制！

替换Transformer！谷歌提出 Performer 模型，全面提升注意力机制！

专知会员服务

43+阅读 · 2020年10月29日

【WWW2020-中科大】LightRec:一个内存和搜索高效率的推荐系统

【WWW2020-中科大】LightRec:一个内存和搜索高效率的推荐系统

专知会员服务

49+阅读 · 2020年3月23日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

71+阅读 · 2020年1月17日

LightGCN推荐模型代码解读

LightGCN推荐模型代码解读

机器学习与推荐算法

23+阅读 · 2021年12月23日

【ICLR2021】彩色化变换器，Colorization Transformer

【ICLR2021】彩色化变换器，Colorization Transformer

专知

12+阅读 · 2021年2月10日

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

学术头条

11+阅读 · 2020年3月13日

谷歌NIPS论文Transformer模型解读：只要Attention就够了

谷歌NIPS论文Transformer模型解读：只要Attention就够了

AI100

14+阅读 · 2019年9月9日

智能照明与智慧灯杆在智慧城市中的应用（PPT）

智能照明与智慧灯杆在智慧城市中的应用（PPT）

智能交通技术

10+阅读 · 2019年8月18日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

爱奇艺基于AI的移动端自动化测试框架的设计

爱奇艺基于AI的移动端自动化测试框架的设计

前端之巅

18+阅读 · 2019年2月27日

learn to see in the dark-低照度图像增强算法

learn to see in the dark-低照度图像增强算法

计算机视觉life

16+阅读 · 2019年1月14日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

Maplab：研究视觉惯性建图和定位的开源框架

Maplab：研究视觉惯性建图和定位的开源框架

泡泡机器人SLAM

16+阅读 · 2018年4月4日

非对称完美涡旋光场的产生、调控及在微粒操纵中的应用

国家自然科学基金

0+阅读 · 2017年12月31日

基于LED自适应照明优化的可见光通信网多域耦合传输技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于软件定义的智能光载无线组网模型与控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

软件定义开放光接入网理论模型和控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于移动终端成像系统的多色化学发光可视化分析技术

国家自然科学基金

0+阅读 · 2015年12月31日

弱光非线性结构光照明超分辨成像研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于硅-石墨烯复合结构的高速空间光调制器

国家自然科学基金

0+阅读 · 2015年12月31日

白光LED用特殊价态离子掺杂红色荧光体的制备、结构调控及发光性能研究

国家自然科学基金

0+阅读 · 2014年12月31日

调控光场实现超分辨显微成像的理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

室内眩光的视觉模型研究

国家自然科学基金

2+阅读 · 2014年12月31日

BlenderRAG: High-Fidelity 3D Object Generation via Retrieval-Augmented Code Synthesis

Arxiv

0+阅读 · 5月1日

Power Foam: Unifying Real-Time Differentiable Ray Tracing and Rasterization

Arxiv

0+阅读 · 4月27日

LooseRoPE: Content-aware Attention Manipulation for Semantic Harmonization

Arxiv

0+阅读 · 4月23日

MODEST: Multi-Optics Depth-of-Field Stereo Dataset

Arxiv

0+阅读 · 4月19日

ScenarioControl: Vision-Language Controllable Vectorized Latent Scenario Generation

Arxiv

0+阅读 · 4月18日

Modular Energy Steering for Safe Text-to-Image Generation with Foundation Models

Arxiv

0+阅读 · 4月2日

FlowIt: Global Matching for Optical Flow with Confidence-Guided Refinement

Arxiv

0+阅读 · 3月30日

UniMotion: A Unified Framework for Motion-Text-Vision Understanding and Generation

Arxiv

0+阅读 · 3月23日

Under One Sun: Multi-Object Generative Perception of Materials and Illumination

Arxiv

0+阅读 · 3月19日

Search2Motion: Training-Free Object-Level Motion Control via Attention-Consensus Search

Arxiv

0+阅读 · 3月18日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

2+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

4+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

3+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

16+阅读 · 2月20日

面向低光照图像增强的扩散模型

面向低光照图像增强的扩散模型

专知会员服务

16+阅读 · 2025年10月11日

【ICCV2025】FlowSeek：借助深度基础模型与运动基实现更简易的光流估计

【ICCV2025】FlowSeek：借助深度基础模型与运动基实现更简易的光流估计

专知会员服务

9+阅读 · 2025年9月8日

用GPT-4实现可控文本图像生成，UC伯克利&微软提出新框架Control-GPT

用GPT-4实现可控文本图像生成，UC伯克利&微软提出新框架Control-GPT

专知会员服务

35+阅读 · 2023年6月3日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

专知会员服务

67+阅读 · 2022年7月8日

最新LightGBM进展介绍报告，39页ppt

最新LightGBM进展介绍报告，39页ppt

专知会员服务

31+阅读 · 2021年1月15日

替换Transformer！谷歌提出 Performer 模型，全面提升注意力机制！

替换Transformer！谷歌提出 Performer 模型，全面提升注意力机制！

专知会员服务

43+阅读 · 2020年10月29日

【WWW2020-中科大】LightRec:一个内存和搜索高效率的推荐系统

【WWW2020-中科大】LightRec:一个内存和搜索高效率的推荐系统

专知会员服务

49+阅读 · 2020年3月23日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

71+阅读 · 2020年1月17日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

LightGCN推荐模型代码解读

LightGCN推荐模型代码解读

机器学习与推荐算法

23+阅读 · 2021年12月23日

【ICLR2021】彩色化变换器，Colorization Transformer

【ICLR2021】彩色化变换器，Colorization Transformer

专知

12+阅读 · 2021年2月10日

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

学术头条

11+阅读 · 2020年3月13日

谷歌NIPS论文Transformer模型解读：只要Attention就够了

谷歌NIPS论文Transformer模型解读：只要Attention就够了

AI100

14+阅读 · 2019年9月9日

智能照明与智慧灯杆在智慧城市中的应用（PPT）

智能照明与智慧灯杆在智慧城市中的应用（PPT）

智能交通技术

10+阅读 · 2019年8月18日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

爱奇艺基于AI的移动端自动化测试框架的设计

爱奇艺基于AI的移动端自动化测试框架的设计

前端之巅

18+阅读 · 2019年2月27日

learn to see in the dark-低照度图像增强算法

learn to see in the dark-低照度图像增强算法

计算机视觉life

16+阅读 · 2019年1月14日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

Maplab：研究视觉惯性建图和定位的开源框架

Maplab：研究视觉惯性建图和定位的开源框架

泡泡机器人SLAM

16+阅读 · 2018年4月4日

相关论文

BlenderRAG: High-Fidelity 3D Object Generation via Retrieval-Augmented Code Synthesis

Arxiv

0+阅读 · 5月1日

Power Foam: Unifying Real-Time Differentiable Ray Tracing and Rasterization

Arxiv

0+阅读 · 4月27日

LooseRoPE: Content-aware Attention Manipulation for Semantic Harmonization

Arxiv

0+阅读 · 4月23日

MODEST: Multi-Optics Depth-of-Field Stereo Dataset

Arxiv

0+阅读 · 4月19日

ScenarioControl: Vision-Language Controllable Vectorized Latent Scenario Generation

Arxiv

0+阅读 · 4月18日

Modular Energy Steering for Safe Text-to-Image Generation with Foundation Models

Arxiv

0+阅读 · 4月2日

FlowIt: Global Matching for Optical Flow with Confidence-Guided Refinement

Arxiv

0+阅读 · 3月30日

UniMotion: A Unified Framework for Motion-Text-Vision Understanding and Generation

Arxiv

0+阅读 · 3月23日

Under One Sun: Multi-Object Generative Perception of Materials and Illumination

Arxiv

0+阅读 · 3月19日

Search2Motion: Training-Free Object-Level Motion Control via Attention-Consensus Search

Arxiv

0+阅读 · 3月18日

相关基金

非对称完美涡旋光场的产生、调控及在微粒操纵中的应用

国家自然科学基金

0+阅读 · 2017年12月31日

基于LED自适应照明优化的可见光通信网多域耦合传输技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于软件定义的智能光载无线组网模型与控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

软件定义开放光接入网理论模型和控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于移动终端成像系统的多色化学发光可视化分析技术

国家自然科学基金

0+阅读 · 2015年12月31日

弱光非线性结构光照明超分辨成像研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于硅-石墨烯复合结构的高速空间光调制器

国家自然科学基金

0+阅读 · 2015年12月31日

白光LED用特殊价态离子掺杂红色荧光体的制备、结构调控及发光性能研究

国家自然科学基金

0+阅读 · 2014年12月31日

调控光场实现超分辨显微成像的理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

室内眩光的视觉模型研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员