Humans can infer material characteristics of objects from their visual appearance, and this ability extends to artistic depictions, where similar perceptual strategies guide the interpretation of paintings or drawings. Among the factors that define material appearance, gloss, along with color, is widely regarded as one of the most important, and recent studies indicate that humans can perceive gloss independently of the artistic style used to depict an object. To investigate how gloss and artistic style are represented in learned models, we train an unsupervised generative model on a newly curated dataset of painterly objects designed to systematically vary such factors. Our analysis reveals a hierarchical latent space in which gloss is disentangled from other appearance factors, allowing for a detailed study of how gloss is represented and varies across artistic styles. Building on this representation, we introduce a lightweight adapter that connects our style- and gloss-aware latent space to a latent-diffusion model, enabling the synthesis of non-photorealistic images with fine-grained control of these factors. We compare our approach with previous models and observe improved disentanglement and controllability of the learned factors.


翻译:人类能够从物体的视觉外观推断其材质特性,这种能力延伸至艺术描绘领域,相似的感知策略引导着对绘画或素描作品的解读。在决定材质外观的诸多因素中,光泽度与色彩被广泛视为最重要的因素之一,近期研究表明,人类能够独立于描绘物体所采用的艺术风格来感知光泽度。为探究光泽度与艺术风格在学习模型中的表征方式,我们在一个新构建的绘画对象数据集上训练了一个无监督生成模型,该数据集专为系统化调控上述因素而设计。我们的分析揭示了一个层次化的潜在空间,其中光泽度与其他外观因素实现解耦,从而允许对光泽度的表征方式及其在不同艺术风格间的变化进行细致研究。基于此表征,我们引入了一个轻量级适配器,将我们的风格与光泽感知潜在空间与一个潜在扩散模型相连接,实现了对非真实感图像的综合生成,并能够对这些因素进行细粒度控制。通过与先前模型的比较,我们观察到所学因素在解耦性与可控性方面均得到提升。

0
下载
关闭预览

相关内容

艺术迄今依旧没有公认的定义,目前广义的艺术乃是由具有智能思考能力的动物,透过各种形式及工具以表达其情感与意识,因而产生的结果。艺术不只存在于人类社会中,也存在于其他相对高等的动物。
【博士论文】视觉-语言模型时代的生成式视觉传播
专知会员服务
24+阅读 · 2024年12月10日
【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法
专知会员服务
26+阅读 · 2022年4月20日
 【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
29+阅读 · 2020年5月19日
专家报告 | 个性化图像美学评价
中国图象图形学报
14+阅读 · 2020年7月15日
SIGGRAPH 2020 | 开源代码实现从草图生成人脸
计算机视觉life
11+阅读 · 2020年7月1日
CVPR 2019 | 无监督领域特定单图像去模糊
PaperWeekly
14+阅读 · 2019年3月20日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
图像美学质量评价技术发展趋势
科技导报
19+阅读 · 2018年6月25日
交互设计理论:视觉感知、认知摩擦、认知负荷和情境认知
人人都是产品经理
20+阅读 · 2018年5月10日
图像风格迁移(Neural Style)简史
算法与数学之美
21+阅读 · 2018年2月4日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
10+阅读 · 2021年8月4日
VIP会员
相关资讯
专家报告 | 个性化图像美学评价
中国图象图形学报
14+阅读 · 2020年7月15日
SIGGRAPH 2020 | 开源代码实现从草图生成人脸
计算机视觉life
11+阅读 · 2020年7月1日
CVPR 2019 | 无监督领域特定单图像去模糊
PaperWeekly
14+阅读 · 2019年3月20日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
图像美学质量评价技术发展趋势
科技导报
19+阅读 · 2018年6月25日
交互设计理论:视觉感知、认知摩擦、认知负荷和情境认知
人人都是产品经理
20+阅读 · 2018年5月10日
图像风格迁移(Neural Style)简史
算法与数学之美
21+阅读 · 2018年2月4日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员