Most colorization models condition only on a single reference, typically the first frame of the scene. However, this approach ignores other sources of conditional data, such as character sheets, background images, or arbitrary colorized frames. We propose TimeColor, a sketch-based video colorization model that supports heterogeneous, variable-count references with the use of explicit per-reference region assignment. TimeColor encodes references as additional latent frames which are concatenated temporally, permitting them to be processed concurrently in each diffusion step while keeping the model's parameter count fixed. TimeColor also uses spatiotemporal correspondence-masked attention to enforce subject-reference binding in addition to modality-disjoint RoPE indexing. These mechanisms mitigate shortcutting and cross-identity palette leakage. Experiments on SAKUGA-42M under both single- and multi-reference protocols show that TimeColor improves color fidelity, identity consistency, and temporal stability over prior baselines.


翻译:大多数着色模型仅以单一参考(通常是场景的首帧)作为条件。然而,这种方法忽略了其他条件数据源,例如角色设定图、背景图像或任意已着色帧。我们提出TimeColor,一种基于线稿的视频着色模型,它通过显式的逐参考区域分配,支持异构且数量可变的参考。TimeColor将参考编码为额外的潜在帧,并在时间维度上进行拼接,使得它们能在每个扩散步骤中被并行处理,同时保持模型参数量不变。TimeColor还使用时空对应掩码注意力,并结合模态分离的RoPE索引,以加强主体与参考之间的绑定。这些机制缓解了捷径学习与跨身份调色板泄漏问题。在SAKUGA-42M数据集上进行的单参考与多参考协议实验表明,相较于现有基线方法,TimeColor在色彩保真度、身份一致性和时序稳定性方面均有提升。

0
下载
关闭预览

相关内容

【博士论文】视频理解:时间维度的深度透视
专知会员服务
7+阅读 · 2月5日
时序知识图谱表示学习
专知会员服务
154+阅读 · 2022年9月17日
【ICML2022】时序自监督视频transformer
专知会员服务
31+阅读 · 2022年7月28日
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
14+阅读 · 2022年5月4日
【ICLR2021】彩色化变换器,Colorization Transformer
专知会员服务
10+阅读 · 2021年2月9日
预知未来——Gluon 时间序列工具包(GluonTS)
ApacheMXNet
24+阅读 · 2019年6月25日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
DeOldify:用GAN为黑白照片重新着色
论智
34+阅读 · 2018年11月2日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
基于 Keras 用深度学习预测时间序列
R语言中文社区
23+阅读 · 2018年7月27日
ETP:精确时序动作定位
极市平台
13+阅读 · 2018年5月25日
(Python)时序预测的七种方法
云栖社区
10+阅读 · 2018年2月25日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 1月20日
Arxiv
0+阅读 · 1月12日
VIP会员
相关VIP内容
【博士论文】视频理解:时间维度的深度透视
专知会员服务
7+阅读 · 2月5日
时序知识图谱表示学习
专知会员服务
154+阅读 · 2022年9月17日
【ICML2022】时序自监督视频transformer
专知会员服务
31+阅读 · 2022年7月28日
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
14+阅读 · 2022年5月4日
【ICLR2021】彩色化变换器,Colorization Transformer
专知会员服务
10+阅读 · 2021年2月9日
相关资讯
预知未来——Gluon 时间序列工具包(GluonTS)
ApacheMXNet
24+阅读 · 2019年6月25日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
DeOldify:用GAN为黑白照片重新着色
论智
34+阅读 · 2018年11月2日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
基于 Keras 用深度学习预测时间序列
R语言中文社区
23+阅读 · 2018年7月27日
ETP:精确时序动作定位
极市平台
13+阅读 · 2018年5月25日
(Python)时序预测的七种方法
云栖社区
10+阅读 · 2018年2月25日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员