Portrait Stylization aims to imbue portrait photos with vivid artistic effects drawn from style examples. Despite the availability of enormous training datasets and large network weights, existing methods struggle to maintain geometric consistency and achieve satisfactory stylization effects due to the disparity in facial feature distributions between facial photographs and stylized images, limiting the application on rare styles and mobile devices. To alleviate this, we propose to establish meaningful geometric correlations between portraits and style samples to simplify the stylization by aligning corresponding facial characteristics. Specifically, we integrate differentiable Thin-Plate-Spline (TPS) modules into an end-to-end Generative Adversarial Network (GAN) framework to improve the training efficiency and promote the consistency of facial identities. By leveraging inherent structural information of faces, e.g., facial landmarks, TPS module can establish geometric alignments between the two domains, at global and local scales, both in pixel and feature spaces, thereby overcoming the aforementioned challenges. Quantitative and qualitative comparisons on a range of portrait stylization tasks demonstrate that our models not only outperforms existing models in terms of fidelity and stylistic consistency, but also achieves remarkable improvements in 2x training data efficiency and 100x less computational complexity, allowing our lightweight model to achieve real-time inference (30 FPS) at 512*512 resolution on mobile devices.


翻译:肖像风格化的目标是为肖像照片赋予来自风格示例的生动艺术效果。尽管存在海量训练数据集和大型网络权重,但由于面部照片与风格化图像之间面部特征分布的差异,现有方法难以保持几何一致性并实现令人满意的风格化效果,这限制了其在稀有风格和移动设备上的应用。为缓解此问题,我们提出在肖像与风格样本之间建立有意义的几何关联,通过对齐相应的面部特征来简化风格化过程。具体而言,我们将可微分薄板样条(TPS)模块集成到端到端生成对抗网络(GAN)框架中,以提高训练效率并增强面部身份一致性。通过利用面部固有结构信息(如面部关键点),TPS模块能够在像素空间和特征空间中,从全局和局部尺度建立两个域之间的几何对齐,从而克服上述挑战。在一系列肖像风格化任务上的定量与定性比较表明,我们的模型不仅在保真度和风格一致性方面优于现有模型,而且在训练数据效率上实现了2倍提升,计算复杂度降低100倍,使得我们的轻量化模型能够在移动设备上以512*512分辨率实现实时推理(30 FPS)。

0
下载
关闭预览

相关内容

基于神经网络的图像风格迁移算法综述
专知会员服务
12+阅读 · 2025年5月29日
《3D神经风格化进展》综述
专知会员服务
28+阅读 · 2023年12月24日
基于深度学习的图像融合方法综述
专知会员服务
57+阅读 · 2023年1月25日
【SIGGRAPH 2022】域增强的任意图像风格对比迁移方法
专知会员服务
26+阅读 · 2022年4月20日
专知会员服务
34+阅读 · 2021年10月8日
【芝加哥大学】可变形的风格转移,Deformable Style Transfer
专知会员服务
31+阅读 · 2020年3月26日
数据中台:基于标签体系的360°用户画像
THU数据派
13+阅读 · 2020年7月25日
用户画像技术及方法论
DataFunTalk
13+阅读 · 2020年5月27日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
图像风格迁移(Neural Style)简史
算法与数学之美
21+阅读 · 2018年2月4日
【大数据】如何用大数据构建精准用户画像?
产业智能官
12+阅读 · 2017年9月21日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员