WildCap：基于混合逆向渲染的野外人脸反照率采集 (WildCap: Facial Albedo Capture in the Wild via Hybrid Inverse Rendering) - 专知论文

会员服务 ·

0

人脸 · 混合 · 可控 · 集成 · CAP ·

WildCap: Facial Albedo Capture in the Wild via Hybrid Inverse Rendering

翻译：WildCap：基于混合逆向渲染的野外人脸反照率采集

Yuxuan Han,Xin Ming,Tianxiao Li,Zhuofan Shen,Qixuan Zhang,Lan Xu,Feng Xu

from arxiv, CVPR 2026. project page: https://yxuhan.github.io/WildCap/index.html; code: https://github.com/yxuhan/WildCap

Existing methods achieve high-quality facial albedo capture under controllable lighting, which increases capture cost and limits usability. We propose WildCap, a novel method for high-quality facial albedo capture from a smartphone video recorded in the wild. To disentangle high-quality albedo from complex lighting effects in in-the-wild captures, we propose a novel hybrid inverse rendering framework. We first apply a data-driven method, i.e., SwitchLight, to convert the captured images into more constrained conditions and then adopt model-based inverse rendering. However, unavoidable local artifacts in network predictions, such as shadow-baking, are non-physical and thus hinder accurate inverse rendering of lighting and material. To address this, we propose a novel texel grid lighting model to explain non-physical effects as clean albedo illuminated by local physical lighting. During optimization, we jointly sample a diffusion prior for the albedo map and optimize the lighting, effectively resolving scale ambiguity between local lights and albedo. Other reflectance maps are then predicted from the albedo. Our method achieves significantly better results than prior arts in the same capture setup, closing the quality gap between in-the-wild and controllable recordings by a large margin.

翻译：现有方法能够在可控光照条件下实现高质量的人脸反照率采集，但这增加了采集成本并限制了实用性。我们提出WildCap，一种从智能手机在野外录制视频中实现高质量人脸反照率采集的新方法。为了在野外采集场景中将高质量反照率与复杂光照效应解耦，我们提出了一种新颖的混合逆向渲染框架。我们首先应用数据驱动方法（即SwitchLight）将采集图像转换为约束更强的条件，随后采用基于模型的逆向渲染。然而，网络预测中不可避免的局部伪影（如阴影烘焙）是非物理性的，因此会阻碍光照与材质的精确逆向渲染。为解决此问题，我们提出了一种新颖的纹理网格光照模型，将非物理效应解释为由局部物理光照照射的纯净反照率。在优化过程中，我们联合采样反照率图的扩散先验并优化光照，有效解决了局部光源与反照率之间的尺度模糊性问题。其他反射率图随后根据反照率进行预测。在相同采集设置下，我们的方法取得了显著优于现有技术的结果，大幅缩小了野外采集与可控录制之间的质量差距。

0

相关内容

《将准确的人物识别扩展到新的高度和范围：BRIAR 数据集》美国橡树岭国家实验室

《将准确的人物识别扩展到新的高度和范围：BRIAR 数据集》美国橡树岭国家实验室

专知会员服务

24+阅读 · 2023年2月4日

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

专知会员服务

21+阅读 · 2022年12月13日

南京大学等最新《深度人脸恢复》综述论文，21页pdf全面阐述深度学习人脸恢复去噪、超分辨率、去模糊、去除伪影方法

南京大学等最新《深度人脸恢复》综述论文，21页pdf全面阐述深度学习人脸恢复去噪、超分辨率、去模糊、去除伪影方法

专知会员服务

15+阅读 · 2022年11月21日

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

专知会员服务

14+阅读 · 2022年3月28日

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

专知会员服务

17+阅读 · 2022年3月19日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

专知会员服务

26+阅读 · 2020年7月24日

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

专知会员服务

24+阅读 · 2020年3月20日

PFLD：简单高效的实用人脸关键点检测算法

PFLD：简单高效的实用人脸关键点检测算法

PaperWeekly

20+阅读 · 2019年4月17日

人脸识别技术全面总结：从传统方法到深度学习

人脸识别技术全面总结：从传统方法到深度学习

算法与数学之美

12+阅读 · 2019年2月27日

learn to see in the dark-低照度图像增强算法

learn to see in the dark-低照度图像增强算法

计算机视觉life

16+阅读 · 2019年1月14日

清华大学发布：人脸识别最全知识图谱

清华大学发布：人脸识别最全知识图谱

全球创新论坛

10+阅读 · 2018年11月21日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于结构特征的人脸识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于毛孔尺度面部特征的高效人脸识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向公共安全的不可控条件下异质人脸图像变换和识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

基于成像环境约束的低质量图像篡改取证研究

国家自然科学基金

1+阅读 · 2015年12月31日

非约束环境下的人脸图像预处理计算模型与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

一种非均匀光照和局部遮挡环境下维吾尔族人脸识别算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

WildDepth: A Multimodal Dataset for 3D Wildlife Perception and Depth Estimation

Arxiv

0+阅读 · 3月17日

Single Image, Any Face: Generalisable 3D Face Generation

Arxiv

0+阅读 · 3月9日

FaceCam: Portrait Video Camera Control via Scale-Aware Conditioning

Arxiv

0+阅读 · 3月5日

VFace: A Training-Free Approach for Diffusion-Based Video Face Swapping

Arxiv

0+阅读 · 2月19日

LAKAN: Landmark-assisted Adaptive Kolmogorov-Arnold Network for Face Forgery Detection

Arxiv

0+阅读 · 2月15日

WISE: A Multimodal Search Engine for Visual Scenes, Audio, Objects, Faces, Speech, and Metadata

Arxiv

0+阅读 · 2月13日

FaceQSORT: a Multi-Face Tracking Method based on Biometric and Appearance Features

Arxiv

0+阅读 · 2月12日

Surveillance Facial Image Quality Assessment: A Multi-dimensional Dataset and Lightweight Model

Arxiv

0+阅读 · 2月7日

Exploring Specular Reflection Inconsistency for Generalizable Face Forgery Detection

Arxiv

0+阅读 · 2月6日

JOintGS: Joint Optimization of Cameras, Bodies and 3D Gaussians for In-the-Wild Monocular Reconstruction

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

大语言模型溯因推理的统一分类学与综述

大语言模型溯因推理的统一分类学与综述

专知会员服务

0+阅读 · 10分钟前

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

专知会员服务

0+阅读 · 23分钟前

大语言模型与国防战略：升级风险与国家安全挑战（综述）

大语言模型与国防战略：升级风险与国家安全挑战（综述）

专知会员服务

5+阅读 · 今天4:52

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

专知会员服务

9+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第二部分

以机器速度作战：人工智能与美陆军反火力作战——第二部分

专知会员服务

6+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第一部分

以机器速度作战：人工智能与美陆军反火力作战——第一部分

专知会员服务

5+阅读 · 4月11日

大视觉语言模型的高效推理：瓶颈剖析、关键技术与未来展望

大视觉语言模型的高效推理：瓶颈剖析、关键技术与未来展望

专知会员服务

6+阅读 · 4月11日

面向空中机器人的视觉语言导航：迈向大语言模型时代

面向空中机器人的视觉语言导航：迈向大语言模型时代

专知会员服务

6+阅读 · 4月11日

美/以-伊战争：停火与后续情景与影响分析

美/以-伊战争：停火与后续情景与影响分析

专知会员服务

3+阅读 · 4月11日

《美军如何实现快速、持续的小型无人机系统采办策略研究》最新110页

《美军如何实现快速、持续的小型无人机系统采办策略研究》最新110页

专知会员服务

6+阅读 · 4月11日

美国-以色列-伊朗战争：是否会动用地面部队？

美国-以色列-伊朗战争：是否会动用地面部队？

专知会员服务

1+阅读 · 4月11日

伊朗冲突中的算法战：“史诗怒火”行动与人工智能战场

伊朗冲突中的算法战：“史诗怒火”行动与人工智能战场

专知会员服务

5+阅读 · 4月11日

《美陆军技术出版物：伤员响应、战术战伤救护与急救》2026最新254页

《美陆军技术出版物：伤员响应、战术战伤救护与急救》2026最新254页

专知会员服务

3+阅读 · 4月11日

美国协同作战飞机项目新型无人机发动机

美国协同作战飞机项目新型无人机发动机

专知会员服务

1+阅读 · 4月11日

反无人机 | 美陆军测试“金盾”传感器-射手网络，以机器速度进行反无人机蜂群

反无人机 | 美陆军测试“金盾”传感器-射手网络，以机器速度进行反无人机蜂群

专知会员服务

2+阅读 · 4月11日

相关VIP内容

《将准确的人物识别扩展到新的高度和范围：BRIAR 数据集》美国橡树岭国家实验室

《将准确的人物识别扩展到新的高度和范围：BRIAR 数据集》美国橡树岭国家实验室

专知会员服务

24+阅读 · 2023年2月4日

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

专知会员服务

21+阅读 · 2022年12月13日

南京大学等最新《深度人脸恢复》综述论文，21页pdf全面阐述深度学习人脸恢复去噪、超分辨率、去模糊、去除伪影方法

南京大学等最新《深度人脸恢复》综述论文，21页pdf全面阐述深度学习人脸恢复去噪、超分辨率、去模糊、去除伪影方法

专知会员服务

15+阅读 · 2022年11月21日

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

专知会员服务

14+阅读 · 2022年3月28日

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

【CVPR 2022】基于灵活模态Transformer的人脸防伪 FM-ViT: Flexible Modal Vision Transformers for Face Anti-Spoofing

专知会员服务

17+阅读 · 2022年3月19日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

【CVPR2021】GAN人脸预训练模型

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

最新《人脸识别对抗攻击》综述 | Threat of Adversarial Attacks on Face Recognition: A Comprehensive Survey

专知会员服务

26+阅读 · 2020年7月24日

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

【CVPR2020-Oral-中科院自动化所】元人脸识别，Learning Meta Face Recognition

专知会员服务

24+阅读 · 2020年3月20日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型与国防战略：升级风险与国家安全挑战（综述）

以机器速度作战：人工智能与美陆军反火力作战——第二部分

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

相关资讯

PFLD：简单高效的实用人脸关键点检测算法

PFLD：简单高效的实用人脸关键点检测算法

PaperWeekly

20+阅读 · 2019年4月17日

人脸识别技术全面总结：从传统方法到深度学习

人脸识别技术全面总结：从传统方法到深度学习

算法与数学之美

12+阅读 · 2019年2月27日

learn to see in the dark-低照度图像增强算法

learn to see in the dark-低照度图像增强算法

计算机视觉life

16+阅读 · 2019年1月14日

清华大学发布：人脸识别最全知识图谱

清华大学发布：人脸识别最全知识图谱

全球创新论坛

10+阅读 · 2018年11月21日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

相关论文

WildDepth: A Multimodal Dataset for 3D Wildlife Perception and Depth Estimation

Arxiv

0+阅读 · 3月17日

Single Image, Any Face: Generalisable 3D Face Generation

Arxiv

0+阅读 · 3月9日

FaceCam: Portrait Video Camera Control via Scale-Aware Conditioning

Arxiv

0+阅读 · 3月5日

VFace: A Training-Free Approach for Diffusion-Based Video Face Swapping

Arxiv

0+阅读 · 2月19日

LAKAN: Landmark-assisted Adaptive Kolmogorov-Arnold Network for Face Forgery Detection

Arxiv

0+阅读 · 2月15日

WISE: A Multimodal Search Engine for Visual Scenes, Audio, Objects, Faces, Speech, and Metadata

Arxiv

0+阅读 · 2月13日

FaceQSORT: a Multi-Face Tracking Method based on Biometric and Appearance Features

Arxiv

0+阅读 · 2月12日

Surveillance Facial Image Quality Assessment: A Multi-dimensional Dataset and Lightweight Model

Arxiv

0+阅读 · 2月7日

Exploring Specular Reflection Inconsistency for Generalizable Face Forgery Detection

Arxiv

0+阅读 · 2月6日

JOintGS: Joint Optimization of Cameras, Bodies and 3D Gaussians for In-the-Wild Monocular Reconstruction

Arxiv

0+阅读 · 2月4日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于结构特征的人脸识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于毛孔尺度面部特征的高效人脸识别研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向公共安全的不可控条件下异质人脸图像变换和识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

基于成像环境约束的低质量图像篡改取证研究

国家自然科学基金

1+阅读 · 2015年12月31日

非约束环境下的人脸图像预处理计算模型与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

一种非均匀光照和局部遮挡环境下维吾尔族人脸识别算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员