Multi-view volumetric rendering techniques have recently shown great potential in modeling and synthesizing high-quality head avatars. A common approach to capture full head dynamic performances is to track the underlying geometry using a mesh-based template or 3D cube-based graphics primitives. While these model-based approaches achieve promising results, they often fail to learn complex geometric details such as the mouth interior, hair, and topological changes over time. This paper presents a novel approach to building highly photorealistic digital head avatars. Our method learns a canonical space via an implicit function parameterized by a neural network. It leverages multiresolution hash encoding in the learned feature space, allowing for high-quality, faster training and high-resolution rendering. At test time, our method is driven by a monocular RGB video. Here, an image encoder extracts face-specific features that also condition the learnable canonical space. This encourages deformation-dependent texture variations during training. We also propose a novel optical flow based loss that ensures correspondences in the learned canonical space, thus encouraging artifact-free and temporally consistent renderings. We show results on challenging facial expressions and show free-viewpoint renderings at interactive real-time rates for medium image resolutions. Our method outperforms all existing approaches, both visually and numerically. We will release our multiple-identity dataset to encourage further research. Our Project page is available at: https://vcai.mpi-inf.mpg.de/projects/HQ3DAvatar/


翻译:多视角体积渲染技术近年来在建模和合成高质量头部化身方面展现出巨大潜力。捕获完整头部动态表现的常用方法是利用基于网格模板或三维立方体图形基元追踪底层几何结构。虽然这类基于模型的方法取得了显著成果,但往往难以学习复杂的几何细节,如口腔内部、毛发以及随时间变化的拓扑结构。本文提出了一种构建高逼真度数字头部化身的新方法。该方法通过神经网络参数化的隐式函数学习规范空间,并在学习到的特征空间中利用多分辨率哈希编码,实现了高质量、更快速训练和高分辨率渲染。在测试阶段,我们的方法由单目RGB视频驱动。其中,图像编码器提取人脸特定特征,这些特征同时约束可学习的规范空间,从而在训练过程中鼓励依赖形变的纹理变化。我们还提出了一种基于光流的新损失函数,确保学习到的规范空间中的对应关系,从而产生无伪影且时间一致的渲染结果。我们展示了具有挑战性的面部表情结果,并以中等图像分辨率实现了交互式实时自由视角渲染。我们的方法在视觉和数值上均优于所有现有方法。我们将发布多身份数据集以推动进一步研究。项目页面详见:https://vcai.mpi-inf.mpg.de/projects/HQ3DAvatar/

0
下载
关闭预览

相关内容

专知会员服务
16+阅读 · 2021年5月13日
专知会员服务
41+阅读 · 2020年9月6日
【论文推荐】小样本视频合成,Few-shot Video-to-Video Synthesis
专知会员服务
24+阅读 · 2019年12月15日
【泡泡图灵智库】体积实例感知语义建图与3D对象发现
泡泡机器人SLAM
22+阅读 · 2019年9月7日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
15+阅读 · 2022年10月27日
VIP会员
最新内容
《通过小型无人机系统将情报能力“作战化”》
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
《离线语言支持系统:面向空战战术决策》
专知会员服务
8+阅读 · 6月15日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员