基于风格感知的光泽度控制生成式非真实感渲染 (Style-Aware Gloss Control for Generative Non-Photorealistic Rendering) - 专知论文

会员服务 ·

0

艺术 · 潜在 · 风格感知 · 非真实感渲染 · 解耦 ·

Style-Aware Gloss Control for Generative Non-Photorealistic Rendering

翻译：基于风格感知的光泽度控制生成式非真实感渲染

Santiago Jimenez-Navarro,Belen Masia,Ana Serrano

Humans can infer material characteristics of objects from their visual appearance, and this ability extends to artistic depictions, where similar perceptual strategies guide the interpretation of paintings or drawings. Among the factors that define material appearance, gloss, along with color, is widely regarded as one of the most important, and recent studies indicate that humans can perceive gloss independently of the artistic style used to depict an object. To investigate how gloss and artistic style are represented in learned models, we train an unsupervised generative model on a newly curated dataset of painterly objects designed to systematically vary such factors. Our analysis reveals a hierarchical latent space in which gloss is disentangled from other appearance factors, allowing for a detailed study of how gloss is represented and varies across artistic styles. Building on this representation, we introduce a lightweight adapter that connects our style- and gloss-aware latent space to a latent-diffusion model, enabling the synthesis of non-photorealistic images with fine-grained control of these factors. We compare our approach with previous models and observe improved disentanglement and controllability of the learned factors.

翻译：人类能够从物体的视觉外观推断其材质特性，这种能力延伸至艺术描绘领域，相似的感知策略引导着对绘画或素描作品的解读。在决定材质外观的诸多因素中，光泽度与色彩被广泛视为最重要的因素之一，近期研究表明，人类能够独立于描绘物体所采用的艺术风格来感知光泽度。为探究光泽度与艺术风格在学习模型中的表征方式，我们在一个新构建的绘画对象数据集上训练了一个无监督生成模型，该数据集专为系统化调控上述因素而设计。我们的分析揭示了一个层次化的潜在空间，其中光泽度与其他外观因素实现解耦，从而允许对光泽度的表征方式及其在不同艺术风格间的变化进行细致研究。基于此表征，我们引入了一个轻量级适配器，将我们的风格与光泽感知潜在空间与一个潜在扩散模型相连接，实现了对非真实感图像的综合生成，并能够对这些因素进行细粒度控制。通过与先前模型的比较，我们观察到所学因素在解耦性与可控性方面均得到提升。

0

相关内容

艺术迄今依旧没有公认的定义，目前广义的艺术乃是由具有智能思考能力的动物，透过各种形式及工具以表达其情感与意识，因而产生的结果。艺术不只存在于人类社会中，也存在于其他相对高等的动物。

【剑桥博士论文】基于图像的三维重建：神经隐式表示的可微渲染方法

【剑桥博士论文】基于图像的三维重建：神经隐式表示的可微渲染方法

专知会员服务

18+阅读 · 2025年6月5日

【CVPR2025】面向自监督场景文本识别的语言学感知掩码图像建模

【CVPR2025】面向自监督场景文本识别的语言学感知掩码图像建模

专知会员服务

9+阅读 · 2025年3月25日

【博士论文】视觉-语言模型时代的生成式视觉传播

【博士论文】视觉-语言模型时代的生成式视觉传播

专知会员服务

24+阅读 · 2024年12月10日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

专知会员服务

41+阅读 · 2024年1月20日

《利用可见光范围图像传感器在低照度下进行被动四维成像和识别》美国海军研究办公室报告

《利用可见光范围图像传感器在低照度下进行被动四维成像和识别》美国海军研究办公室报告

专知会员服务

22+阅读 · 2023年9月11日

MBZ大学等最新《视觉基础模型》综述，详述视觉大模型技术进展

MBZ大学等最新《视觉基础模型》综述，详述视觉大模型技术进展

专知会员服务

75+阅读 · 2023年8月1日

【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法

【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法

专知会员服务

26+阅读 · 2022年4月20日

中科院计算所刘昊淼博士论文《面向物体语义理解的视觉表示学习》

中科院计算所刘昊淼博士论文《面向物体语义理解的视觉表示学习》

专知会员服务

44+阅读 · 2020年12月4日

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

专知会员服务

29+阅读 · 2020年5月19日

专家报告 | 个性化图像美学评价

专家报告 | 个性化图像美学评价

中国图象图形学报

14+阅读 · 2020年7月15日

SIGGRAPH 2020 | 开源代码实现从草图生成人脸

SIGGRAPH 2020 | 开源代码实现从草图生成人脸

计算机视觉life

11+阅读 · 2020年7月1日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知

20+阅读 · 2020年3月26日

CVPR 2019 | 无监督领域特定单图像去模糊

CVPR 2019 | 无监督领域特定单图像去模糊

PaperWeekly

14+阅读 · 2019年3月20日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

人人都是产品经理

20+阅读 · 2018年5月10日

图像风格迁移(Neural Style)简史

图像风格迁移(Neural Style)简史

算法与数学之美

21+阅读 · 2018年2月4日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

材质感知与识别及其在大洋矿物分类中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于纳米银片尺寸调控电致变色光谱的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

基于数据挖掘和感知分析的非对称失真视觉质量评价模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向情感认知的产品造型特征与用户意象需求层次映射机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模式情感测量的考虑多维设计特征的产品外观情感设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

调控光场实现超分辨显微成像的理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Style-Aware Gloss Control for Generative Non-Photorealistic Rendering

Arxiv

0+阅读 · 2月18日

LightTact: A Visual-Tactile Fingertip Sensor for Deformation-Independent Contact Sensing

Arxiv

0+阅读 · 2月11日

Rotated Lights for Consistent and Efficient 2D Gaussians Inverse Rendering

Arxiv

0+阅读 · 2月9日

TouchScribe: Augmenting Non-Visual Hand-Object Interactions with Automated Live Visual Descriptions

Arxiv

0+阅读 · 2月8日

Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer

Arxiv

0+阅读 · 2月3日

A thin and soft optical tactile sensor for highly sensitive object perception

Arxiv

0+阅读 · 2月3日

Iconix: Controlling Semantics and Style in Progressive Icon Grids Generation

Arxiv

0+阅读 · 1月31日

Physically Guided Visual Mass Estimation from a Single RGB Image

Arxiv

0+阅读 · 1月28日

Artifact-Aware Evaluation for High-Quality Video Generation

Arxiv

0+阅读 · 1月28日

Question-controlled Text-aware Image Captioning

Arxiv

10+阅读 · 2021年8月4日

VIP会员

文章信息

相关主题

非真实感渲染

相关VIP内容

【剑桥博士论文】基于图像的三维重建：神经隐式表示的可微渲染方法

【剑桥博士论文】基于图像的三维重建：神经隐式表示的可微渲染方法

专知会员服务

18+阅读 · 2025年6月5日

【CVPR2025】面向自监督场景文本识别的语言学感知掩码图像建模

【CVPR2025】面向自监督场景文本识别的语言学感知掩码图像建模

专知会员服务

9+阅读 · 2025年3月25日

【博士论文】视觉-语言模型时代的生成式视觉传播

【博士论文】视觉-语言模型时代的生成式视觉传播

专知会员服务

24+阅读 · 2024年12月10日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

【伯克利博士论文】通过生成式模型实现视觉与语言理解，109页pdf

专知会员服务

41+阅读 · 2024年1月20日

《利用可见光范围图像传感器在低照度下进行被动四维成像和识别》美国海军研究办公室报告

《利用可见光范围图像传感器在低照度下进行被动四维成像和识别》美国海军研究办公室报告

专知会员服务

22+阅读 · 2023年9月11日

MBZ大学等最新《视觉基础模型》综述，详述视觉大模型技术进展

MBZ大学等最新《视觉基础模型》综述，详述视觉大模型技术进展

专知会员服务

75+阅读 · 2023年8月1日

【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法

【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法

专知会员服务

26+阅读 · 2022年4月20日

中科院计算所刘昊淼博士论文《面向物体语义理解的视觉表示学习》

中科院计算所刘昊淼博士论文《面向物体语义理解的视觉表示学习》

专知会员服务

44+阅读 · 2020年12月4日

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

专知会员服务

29+阅读 · 2020年5月19日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

专家报告 | 个性化图像美学评价

专家报告 | 个性化图像美学评价

中国图象图形学报

14+阅读 · 2020年7月15日

SIGGRAPH 2020 | 开源代码实现从草图生成人脸

SIGGRAPH 2020 | 开源代码实现从草图生成人脸

计算机视觉life

11+阅读 · 2020年7月1日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知

20+阅读 · 2020年3月26日

CVPR 2019 | 无监督领域特定单图像去模糊

CVPR 2019 | 无监督领域特定单图像去模糊

PaperWeekly

14+阅读 · 2019年3月20日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

人人都是产品经理

20+阅读 · 2018年5月10日

图像风格迁移(Neural Style)简史

图像风格迁移(Neural Style)简史

算法与数学之美

21+阅读 · 2018年2月4日

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

【论文推荐】最新5篇图像描述生成（Image Caption）相关论文—情感、注意力机制、遥感图像、序列到序列、深度神经结构

专知

66+阅读 · 2018年1月31日

相关论文

Style-Aware Gloss Control for Generative Non-Photorealistic Rendering

Arxiv

0+阅读 · 2月18日

LightTact: A Visual-Tactile Fingertip Sensor for Deformation-Independent Contact Sensing

Arxiv

0+阅读 · 2月11日

Rotated Lights for Consistent and Efficient 2D Gaussians Inverse Rendering

Arxiv

0+阅读 · 2月9日

TouchScribe: Augmenting Non-Visual Hand-Object Interactions with Automated Live Visual Descriptions

Arxiv

0+阅读 · 2月8日

Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer

Arxiv

0+阅读 · 2月3日

A thin and soft optical tactile sensor for highly sensitive object perception

Arxiv

0+阅读 · 2月3日

Iconix: Controlling Semantics and Style in Progressive Icon Grids Generation

Arxiv

0+阅读 · 1月31日

Physically Guided Visual Mass Estimation from a Single RGB Image

Arxiv

0+阅读 · 1月28日

Artifact-Aware Evaluation for High-Quality Video Generation

Arxiv

0+阅读 · 1月28日

Question-controlled Text-aware Image Captioning

Arxiv

10+阅读 · 2021年8月4日

相关基金

材质感知与识别及其在大洋矿物分类中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于纳米银片尺寸调控电致变色光谱的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

基于数据挖掘和感知分析的非对称失真视觉质量评价模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向情感认知的产品造型特征与用户意象需求层次映射机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模式情感测量的考虑多维设计特征的产品外观情感设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

调控光场实现超分辨显微成像的理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员