Humans can infer material characteristics of objects from their visual appearance, and this ability extends to artistic depictions, where similar perceptual strategies guide the interpretation of paintings or drawings. Among the factors that define material appearance, gloss, along with color, is widely regarded as one of the most important, and recent studies indicate that humans can perceive gloss independently of the artistic style used to depict an object. To investigate how gloss and artistic style are represented in learned models, we train an unsupervised generative model on a newly curated dataset of painterly objects designed to systematically vary such factors. Our analysis reveals a hierarchical latent space in which gloss is disentangled from other appearance factors, allowing for a detailed study of how gloss is represented and varies across artistic styles. Building on this representation, we introduce a lightweight adapter that connects our style- and gloss-aware latent space to a latent-diffusion model, enabling the synthesis of non-photorealistic images with fine-grained control of these factors. We compare our approach with previous models and observe improved disentanglement and controllability of the learned factors.


翻译:人类能够从物体的视觉外观推断其材质特性,这种能力同样适用于艺术描绘——在解读绘画或素描作品时,类似的感知策略指导着人们的理解。在定义材质外观的诸多因素中,光泽度与色彩被广泛视为最重要的因素之一;近期研究表明,人类能够独立于描绘物体所采用的艺术风格来感知光泽度。为探究光泽度与艺术风格在学习模型中的表征方式,我们在一个新构建的绘画性物体数据集上训练了无监督生成模型,该数据集专门针对此类因素进行系统性变化设计。分析表明,模型学习到的隐空间具有层次化结构,其中光泽度与其他外观因素实现解耦,这为深入研究光泽度在不同艺术风格中的表征与变化规律提供了可能。基于此表征,我们提出一种轻量级适配器,将我们具备风格与光泽感知能力的隐空间与隐扩散模型相连接,从而实现对非真实感图像的合成,并支持对这些因素的细粒度控制。通过与现有模型的对比实验,我们观察到所学因素在解耦性与可控性方面均获得提升。

0
下载
关闭预览

相关内容

艺术迄今依旧没有公认的定义,目前广义的艺术乃是由具有智能思考能力的动物,透过各种形式及工具以表达其情感与意识,因而产生的结果。艺术不只存在于人类社会中,也存在于其他相对高等的动物。
《认知战态势感知可视化框架》
专知会员服务
84+阅读 · 2024年12月13日
【博士论文】视觉-语言模型时代的生成式视觉传播
专知会员服务
24+阅读 · 2024年12月10日
【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法
专知会员服务
26+阅读 · 2022年4月20日
【芝加哥大学】可变形的风格转移,Deformable Style Transfer
专知会员服务
31+阅读 · 2020年3月26日
专家报告 | 个性化图像美学评价
中国图象图形学报
14+阅读 · 2020年7月15日
CVPR 2019 | 无监督领域特定单图像去模糊
PaperWeekly
14+阅读 · 2019年3月20日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
图像美学质量评价技术发展趋势
科技导报
19+阅读 · 2018年6月25日
交互设计理论:视觉感知、认知摩擦、认知负荷和情境认知
人人都是产品经理
20+阅读 · 2018年5月10日
图像风格迁移(Neural Style)简史
算法与数学之美
21+阅读 · 2018年2月4日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员