MeGA：用于高保真渲染与头部编辑的混合网格-高斯头部化身 (MeGA: Hybrid Mesh-Gaussian Head Avatar for High-Fidelity Rendering and Head Editing) - 专知论文

会员服务 ·

0

高保真 · 混合 · 网格 · 表示 · 多视角 ·

MeGA: Hybrid Mesh-Gaussian Head Avatar for High-Fidelity Rendering and Head Editing

翻译：MeGA：用于高保真渲染与头部编辑的混合网格-高斯头部化身

Cong Wang,Di Kang,He-Yi Sun,Shen-Han Qian,Zi-Xuan Wang,Linchao Bao,Song-Hai Zhang

from arxiv, Accepted by CVPR 2025. Project page: https://conallwang.github.io/MeGA_Pages/

Creating high-fidelity head avatars from multi-view videos is a core issue for many AR/VR applications. However, existing methods usually struggle to obtain high-quality renderings for all different head components simultaneously since they use one single representation to model components with drastically different characteristics (e.g., skin vs. hair). In this paper, we propose a Hybrid Mesh-Gaussian Head Avatar (MeGA) that models different head components with more suitable representations. Specifically, we select an enhanced FLAME mesh as our facial representation and predict a UV displacement map to provide per-vertex offsets for improved personalized geometric details. To achieve photorealistic renderings, we obtain facial colors using deferred neural rendering and disentangle neural textures into three meaningful parts. For hair modeling, we first build a static canonical hair using 3D Gaussian Splatting. A rigid transformation and an MLP-based deformation field are further applied to handle complex dynamic expressions. Combined with our occlusion-aware blending, MeGA generates higher-fidelity renderings for the whole head and naturally supports more downstream tasks. Experiments on the NeRSemble dataset demonstrate the effectiveness of our designs, outperforming previous state-of-the-art methods and supporting various editing functionalities, including hairstyle alteration and texture editing.

翻译：从多视角视频中创建高保真头部化身是许多AR/VR应用的核心问题。然而，现有方法通常难以同时为所有不同的头部组件获取高质量的渲染结果，因为它们使用单一表示来建模具有截然不同特性的组件（例如皮肤与头发）。本文提出了一种混合网格-高斯头部化身（MeGA），它使用更合适的表示来建模不同的头部组件。具体而言，我们选择增强的FLAME网格作为面部表示，并预测一个UV位移图来提供逐顶点偏移，以改善个性化的几何细节。为了实现照片级真实感的渲染，我们使用延迟神经渲染获取面部颜色，并将神经纹理解耦为三个有意义的组成部分。对于头发建模，我们首先使用3D高斯泼溅构建静态的规范头发。进一步应用刚性变换和基于MLP的变形场来处理复杂的动态表情。结合我们提出的遮挡感知混合方法，MeGA能够为整个头部生成更高保真度的渲染结果，并自然地支持更多下游任务。在NeRSemble数据集上的实验证明了我们设计的有效性，其性能优于先前的最先进方法，并支持包括发型更改和纹理编辑在内的多种编辑功能。

0

相关内容

高保真

三维高斯泼溅应用综述：分割、编辑与生成

三维高斯泼溅应用综述：分割、编辑与生成

专知会员服务

15+阅读 · 2025年8月14日

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

专知会员服务

10+阅读 · 2025年1月9日

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

专知会员服务

25+阅读 · 2024年3月3日

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

专知会员服务

43+阅读 · 2024年2月18日

【CMU博士论文】高斯表示的可微渲染和优化，198页pdf

【CMU博士论文】高斯表示的可微渲染和优化，198页pdf

专知会员服务

27+阅读 · 2023年10月5日

Meta-Transformer：多模态学习的统一框架

Meta-Transformer：多模态学习的统一框架

专知会员服务

59+阅读 · 2023年7月21日

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

专知会员服务

39+阅读 · 2022年8月9日

虚拟人创作更真更快！浪潮信息联手NVIDIA打造元宇宙算力方案

虚拟人创作更真更快！浪潮信息联手NVIDIA打造元宇宙算力方案

专知会员服务

22+阅读 · 2022年7月25日

【斯坦福&Facebook】生成式对抗变换器，Generative Adversarial Transformers

专知会员服务

21+阅读 · 2021年4月21日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！

DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！

新智元

13+阅读 · 2019年7月9日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

旷视研究院新出8000点人脸关键点，堪比电影级表情捕捉

旷视研究院新出8000点人脸关键点，堪比电影级表情捕捉

人工智能前沿讲习班

19+阅读 · 2019年5月4日

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

新智元

14+阅读 · 2019年4月17日

Github项目推荐 | SC-FEGAN：基于GAN的人脸照片涂鸦编辑

Github项目推荐 | SC-FEGAN：基于GAN的人脸照片涂鸦编辑

AI研习社

13+阅读 · 2019年2月22日

【GAN】七个不容易被发现的生成对抗网络（GAN）用例；案例详解聚类、回归、分类算法

【GAN】七个不容易被发现的生成对抗网络（GAN）用例；案例详解聚类、回归、分类算法

产业智能官

62+阅读 · 2018年12月9日

以为GAN只能“炮制假图”？它还有这7种另类用途

以为GAN只能“炮制假图”？它还有这7种另类用途

量子位

13+阅读 · 2018年10月23日

基于GAN的极限图像压缩框架

基于GAN的极限图像压缩框架

论智

12+阅读 · 2018年4月15日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

AI研习社

10+阅读 · 2018年3月6日

大规模多视角高维图像特征提取

国家自然科学基金

3+阅读 · 2017年12月31日

灵活栅格光网络中可虚拟化光收发器资源提供机制及性能研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于内容分析的低复杂度高效视频编码方法

国家自然科学基金

0+阅读 · 2015年12月31日

多约束协同的彩色夜视影像亚像素超分辨率重建

国家自然科学基金

1+阅读 · 2015年12月31日

多纹理多深度的3D视频码率控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向视觉质量的高效立体视频编码资源分配优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

大规模爆炸场数值模拟实时交互可视化软件

国家自然科学基金

1+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Gaussian Mesh Renderer for Lightweight Differentiable Rendering

Arxiv

0+阅读 · 2月16日

OMEGA-Avatar: One-shot Modeling of 360° Gaussian Avatars

Arxiv

0+阅读 · 2月12日

GTAvatar: Bridging Gaussian Splatting and Texture Mapping for Relightable and Editable Gaussian Avatars

Arxiv

0+阅读 · 2月9日

OFERA: Blendshape-driven 3D Gaussian Control for Occluded Facial Expression to Realistic Avatars in VR

Arxiv

0+阅读 · 2月2日

VRGaussianAvatar: Integrating 3D Gaussian Avatars into VR

Arxiv

0+阅读 · 2月2日

FastGHA: Generalized Few-Shot 3D Gaussian Head Avatars with Real-Time Animation

Arxiv

0+阅读 · 1月30日

ToonifyGB: StyleGAN-based Gaussian Blendshapes for 3D Stylized Head Avatars

Arxiv

0+阅读 · 1月23日

CGS-GAN: 3D Consistent Gaussian Splatting GANs for High Resolution Human Head Synthesis

Arxiv

0+阅读 · 1月22日

CAG-Avatar: Cross-Attention Guided Gaussian Avatars for High-Fidelity Head Reconstruction

Arxiv

0+阅读 · 1月21日

ELITE: Efficient Gaussian Head Avatar from a Monocular Video via Learned Initialization and TEst-time Generative Adaptation

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

相关VIP内容

三维高斯泼溅应用综述：分割、编辑与生成

三维高斯泼溅应用综述：分割、编辑与生成

专知会员服务

15+阅读 · 2025年8月14日

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

专知会员服务

10+阅读 · 2025年1月9日

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

专知会员服务

25+阅读 · 2024年3月3日

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

专知会员服务

43+阅读 · 2024年2月18日

【CMU博士论文】高斯表示的可微渲染和优化，198页pdf

【CMU博士论文】高斯表示的可微渲染和优化，198页pdf

专知会员服务

27+阅读 · 2023年10月5日

Meta-Transformer：多模态学习的统一框架

Meta-Transformer：多模态学习的统一框架

专知会员服务

59+阅读 · 2023年7月21日

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

专知会员服务

39+阅读 · 2022年8月9日

虚拟人创作更真更快！浪潮信息联手NVIDIA打造元宇宙算力方案

虚拟人创作更真更快！浪潮信息联手NVIDIA打造元宇宙算力方案

专知会员服务

22+阅读 · 2022年7月25日

【斯坦福&Facebook】生成式对抗变换器，Generative Adversarial Transformers

专知会员服务

21+阅读 · 2021年4月21日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！

DeepMind爆出无监督表示学习模型BigBiGAN，GAN之父点赞！

新智元

13+阅读 · 2019年7月9日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

旷视研究院新出8000点人脸关键点，堪比电影级表情捕捉

旷视研究院新出8000点人脸关键点，堪比电影级表情捕捉

人工智能前沿讲习班

19+阅读 · 2019年5月4日

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

新智元

14+阅读 · 2019年4月17日

Github项目推荐 | SC-FEGAN：基于GAN的人脸照片涂鸦编辑

Github项目推荐 | SC-FEGAN：基于GAN的人脸照片涂鸦编辑

AI研习社

13+阅读 · 2019年2月22日

【GAN】七个不容易被发现的生成对抗网络（GAN）用例；案例详解聚类、回归、分类算法

【GAN】七个不容易被发现的生成对抗网络（GAN）用例；案例详解聚类、回归、分类算法

产业智能官

62+阅读 · 2018年12月9日

以为GAN只能“炮制假图”？它还有这7种另类用途

以为GAN只能“炮制假图”？它还有这7种另类用途

量子位

13+阅读 · 2018年10月23日

基于GAN的极限图像压缩框架

基于GAN的极限图像压缩框架

论智

12+阅读 · 2018年4月15日

FaceForensics：一个用于人脸伪造检测的大型视频数据集

FaceForensics：一个用于人脸伪造检测的大型视频数据集

论智

18+阅读 · 2018年4月14日

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

AI研习社

10+阅读 · 2018年3月6日

相关论文

Gaussian Mesh Renderer for Lightweight Differentiable Rendering

Arxiv

0+阅读 · 2月16日

OMEGA-Avatar: One-shot Modeling of 360° Gaussian Avatars

Arxiv

0+阅读 · 2月12日

GTAvatar: Bridging Gaussian Splatting and Texture Mapping for Relightable and Editable Gaussian Avatars

Arxiv

0+阅读 · 2月9日

OFERA: Blendshape-driven 3D Gaussian Control for Occluded Facial Expression to Realistic Avatars in VR

Arxiv

0+阅读 · 2月2日

VRGaussianAvatar: Integrating 3D Gaussian Avatars into VR

Arxiv

0+阅读 · 2月2日

FastGHA: Generalized Few-Shot 3D Gaussian Head Avatars with Real-Time Animation

Arxiv

0+阅读 · 1月30日

ToonifyGB: StyleGAN-based Gaussian Blendshapes for 3D Stylized Head Avatars

Arxiv

0+阅读 · 1月23日

CGS-GAN: 3D Consistent Gaussian Splatting GANs for High Resolution Human Head Synthesis

Arxiv

0+阅读 · 1月22日

CAG-Avatar: Cross-Attention Guided Gaussian Avatars for High-Fidelity Head Reconstruction

Arxiv

0+阅读 · 1月21日

ELITE: Efficient Gaussian Head Avatar from a Monocular Video via Learned Initialization and TEst-time Generative Adaptation

Arxiv

0+阅读 · 1月15日

相关基金

大规模多视角高维图像特征提取

国家自然科学基金

3+阅读 · 2017年12月31日

灵活栅格光网络中可虚拟化光收发器资源提供机制及性能研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于内容分析的低复杂度高效视频编码方法

国家自然科学基金

0+阅读 · 2015年12月31日

多约束协同的彩色夜视影像亚像素超分辨率重建

国家自然科学基金

1+阅读 · 2015年12月31日

多纹理多深度的3D视频码率控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向视觉质量的高效立体视频编码资源分配优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

大规模爆炸场数值模拟实时交互可视化软件

国家自然科学基金

1+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员