Autoregressive Appearance Prediction for 3D Gaussian Avatars - 专知论文

会员服务 ·

0

三维高斯 · 拟合 · 运动模式 · 相关性 · 过拟合 ·

Autoregressive Appearance Prediction for 3D Gaussian Avatars

翻译：三维高斯虚拟化身自回归外观预测

Michael Steiner,Zhang Chen,Alexander Richard,Vasu Agrawal,Markus Steinberger,Michael Zollhöfer

from arxiv, Project Page: https://steimich96.github.io/AAP-3DGA/

A photorealistic and immersive human avatar experience demands capturing fine, person-specific details such as cloth and hair dynamics, subtle facial expressions, and characteristic motion patterns. Achieving this requires large, high-quality datasets, which often introduce ambiguities and spurious correlations when very similar poses correspond to different appearances. Models that fit these details during training can overfit and produce unstable, abrupt appearance changes for novel poses. We propose a 3D Gaussian Splatting avatar model with a spatial MLP backbone that is conditioned on both pose and an appearance latent. The latent is learned during training by an encoder, yielding a compact representation that improves reconstruction quality and helps disambiguate pose-driven renderings. At driving time, our predictor autoregressively infers the latent, producing temporally smooth appearance evolution and improved stability. Overall, our method delivers a robust and practical path to high-fidelity, stable avatar driving.

翻译：实现逼真且沉浸式的人体虚拟化身体验，需要捕捉衣物与头发动态、细微面部表情及特征性运动模式等个性化细节。这需要大规模高质量数据集，但数据中相似姿态对应不同外观的情况频繁出现，常引入歧义性和虚假相关性。若训练过程中直接拟合这些细节，模型可能过拟合，并在处理新姿态时产生不稳定的突变外观。我们提出一种基于3D高斯泼溅的虚拟化身模型，采用空间多层感知机（MLP）主干网络，同时以姿态和外观潜变量为条件。该潜变量通过编码器在训练过程中学习得到，形成紧凑表示，可提升重建质量并消除姿态驱动的渲染歧义。在驱动时，我们的预测器通过自回归方式推断该潜变量，产生时间平滑的外观演化并增强稳定性。总之，本方法为高质量、稳定的虚拟化身驱动提供了一条稳健且实用的路径。

0

相关内容

三维高斯

面向具身智能与机器人仿真的三维生成：综述

面向具身智能与机器人仿真的三维生成：综述

专知会员服务

17+阅读 · 4月30日

具身智能中的心理世界建模：深度综述

具身智能中的心理世界建模：深度综述

专知会员服务

39+阅读 · 1月10日

多模态数字人建模、合成与驱动综述

多模态数字人建模、合成与驱动综述

专知会员服务

30+阅读 · 2024年9月19日

重磅！《具身智能发展报告（2024年）》发布，54页pdf

重磅！《具身智能发展报告（2024年）》发布，54页pdf

专知会员服务

92+阅读 · 2024年8月27日

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

专知会员服务

45+阅读 · 2024年3月12日

虚拟人行业深度报告：AI驱动虚拟人产业升级，应用场景进一步拓展

虚拟人行业深度报告：AI驱动虚拟人产业升级，应用场景进一步拓展

专知会员服务

50+阅读 · 2023年7月1日

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

专知会员服务

30+阅读 · 2022年3月8日

自动化所研发全球首个图文音三模态预训练模型，让AI更接近人类想象力！

自动化所研发全球首个图文音三模态预训练模型，让AI更接近人类想象力！

专知会员服务

35+阅读 · 2021年7月8日

多模态预训练模型简述

多模态预训练模型简述

专知会员服务

115+阅读 · 2021年4月27日

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

专知会员服务

29+阅读 · 2020年4月5日

虚拟数字人发展白皮书，37页pdf

虚拟数字人发展白皮书，37页pdf

专知

10+阅读 · 2022年2月16日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

三维重建 3D reconstruction 有哪些实用算法？

三维重建 3D reconstruction 有哪些实用算法？

极市平台

13+阅读 · 2020年2月23日

加强版CycleGAN！贾佳亚等提出卡通图与真实人脸转换模型，看女神突破次元壁长啥样

加强版CycleGAN！贾佳亚等提出卡通图与真实人脸转换模型，看女神突破次元壁长啥样

量子位

10+阅读 · 2019年7月11日

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

机器之心

18+阅读 · 2019年6月12日

计算机视觉方向简介 | 人体姿态估计

计算机视觉方向简介 | 人体姿态估计

计算机视觉life

28+阅读 · 2019年6月6日

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

极市平台

29+阅读 · 2019年4月25日

人脸专集2 | 人脸关键点检测汇总（文末有相关文章链接）

人脸专集2 | 人脸关键点检测汇总（文末有相关文章链接）

计算机视觉战队

25+阅读 · 2019年4月4日

人脸相关算法、数据集、文献资源大列表

人脸相关算法、数据集、文献资源大列表

专知

16+阅读 · 2019年3月16日

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

极市平台

12+阅读 · 2018年2月2日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于单目RGB/RGBD相机的身体运动和面部运动同步捕获方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

基于高精度高效率CFD方法和三通道三回路控制方案的数值虚拟飞行研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

非约束环境下的人脸图像预处理计算模型与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

形状先验和数据驱动的高分辨遥感影像目标提取

国家自然科学基金

3+阅读 · 2014年12月31日

面向三维服装建模的形状分析与处理方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

超光谱、全偏振、立体形貌的多模态成像研究

国家自然科学基金

0+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

3D Generation for Embodied AI and Robotic Simulation: A Survey

Arxiv

0+阅读 · 4月29日

OmniFit: Multi-modal 3D Body Fitting via Scale-agnostic Dense Landmark Prediction

Arxiv

0+阅读 · 4月23日

InHabit: Leveraging Image Foundation Models for Scalable 3D Human Placement

Arxiv

0+阅读 · 4月21日

ETCH-X: Robustify Expressive Body Fitting to Clothed Humans with Composable Datasets

Arxiv

0+阅读 · 4月9日

Large-scale Codec Avatars: The Unreasonable Effectiveness of Large-scale Avatar Pretraining

Arxiv

0+阅读 · 4月7日

Large-scale Codec Avatars: The Unreasonable Effectiveness of Large-scale Avatar Pretraining

Arxiv

0+阅读 · 4月2日

Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching

Arxiv

0+阅读 · 3月30日

Drive-Through 3D Vehicle Exterior Reconstruction via Dynamic-Scene SfM and Distortion-Aware Gaussian Splatting

Arxiv

0+阅读 · 3月27日

Skullptor: High Fidelity 3D Head Reconstruction in Seconds with Multi-View Normal Prediction

Arxiv

0+阅读 · 3月27日

GraphiContact: Pose-aware Human-Scene Robust Contact Perception for Interactive Systems

Arxiv

0+阅读 · 3月19日

VIP会员

文章信息

相关主题

最新内容

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

10+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

6+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

20+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

相关VIP内容

面向具身智能与机器人仿真的三维生成：综述

面向具身智能与机器人仿真的三维生成：综述

专知会员服务

17+阅读 · 4月30日

具身智能中的心理世界建模：深度综述

具身智能中的心理世界建模：深度综述

专知会员服务

39+阅读 · 1月10日

多模态数字人建模、合成与驱动综述

多模态数字人建模、合成与驱动综述

专知会员服务

30+阅读 · 2024年9月19日

重磅！《具身智能发展报告（2024年）》发布，54页pdf

重磅！《具身智能发展报告（2024年）》发布，54页pdf

专知会员服务

92+阅读 · 2024年8月27日

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

专知会员服务

45+阅读 · 2024年3月12日

虚拟人行业深度报告：AI驱动虚拟人产业升级，应用场景进一步拓展

虚拟人行业深度报告：AI驱动虚拟人产业升级，应用场景进一步拓展

专知会员服务

50+阅读 · 2023年7月1日

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

专知会员服务

30+阅读 · 2022年3月8日

自动化所研发全球首个图文音三模态预训练模型，让AI更接近人类想象力！

自动化所研发全球首个图文音三模态预训练模型，让AI更接近人类想象力！

专知会员服务

35+阅读 · 2021年7月8日

多模态预训练模型简述

多模态预训练模型简述

专知会员服务

115+阅读 · 2021年4月27日

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

专知会员服务

29+阅读 · 2020年4月5日

热门VIP内容

开通专知VIP会员享更多权益服务

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

相关资讯

虚拟数字人发展白皮书，37页pdf

虚拟数字人发展白皮书，37页pdf

专知

10+阅读 · 2022年2月16日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

三维重建 3D reconstruction 有哪些实用算法？

三维重建 3D reconstruction 有哪些实用算法？

极市平台

13+阅读 · 2020年2月23日

加强版CycleGAN！贾佳亚等提出卡通图与真实人脸转换模型，看女神突破次元壁长啥样

加强版CycleGAN！贾佳亚等提出卡通图与真实人脸转换模型，看女神突破次元壁长啥样

量子位

10+阅读 · 2019年7月11日

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

KDD 2019 | 自动探索特征组合，第四范式提出新方法AutoCross

机器之心

18+阅读 · 2019年6月12日

计算机视觉方向简介 | 人体姿态估计

计算机视觉方向简介 | 人体姿态估计

计算机视觉life

28+阅读 · 2019年6月6日

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

极市平台

29+阅读 · 2019年4月25日

人脸专集2 | 人脸关键点检测汇总（文末有相关文章链接）

人脸专集2 | 人脸关键点检测汇总（文末有相关文章链接）

计算机视觉战队

25+阅读 · 2019年4月4日

人脸相关算法、数据集、文献资源大列表

人脸相关算法、数据集、文献资源大列表

专知

16+阅读 · 2019年3月16日

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

极市平台

12+阅读 · 2018年2月2日

相关论文

3D Generation for Embodied AI and Robotic Simulation: A Survey

Arxiv

0+阅读 · 4月29日

OmniFit: Multi-modal 3D Body Fitting via Scale-agnostic Dense Landmark Prediction

Arxiv

0+阅读 · 4月23日

InHabit: Leveraging Image Foundation Models for Scalable 3D Human Placement

Arxiv

0+阅读 · 4月21日

ETCH-X: Robustify Expressive Body Fitting to Clothed Humans with Composable Datasets

Arxiv

0+阅读 · 4月9日

Large-scale Codec Avatars: The Unreasonable Effectiveness of Large-scale Avatar Pretraining

Arxiv

0+阅读 · 4月7日

Large-scale Codec Avatars: The Unreasonable Effectiveness of Large-scale Avatar Pretraining

Arxiv

0+阅读 · 4月2日

Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching

Arxiv

0+阅读 · 3月30日

Drive-Through 3D Vehicle Exterior Reconstruction via Dynamic-Scene SfM and Distortion-Aware Gaussian Splatting

Arxiv

0+阅读 · 3月27日

Skullptor: High Fidelity 3D Head Reconstruction in Seconds with Multi-View Normal Prediction

Arxiv

0+阅读 · 3月27日

GraphiContact: Pose-aware Human-Scene Robust Contact Perception for Interactive Systems

Arxiv

0+阅读 · 3月19日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于单目RGB/RGBD相机的身体运动和面部运动同步捕获方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

基于高精度高效率CFD方法和三通道三回路控制方案的数值虚拟飞行研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

非约束环境下的人脸图像预处理计算模型与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

形状先验和数据驱动的高分辨遥感影像目标提取

国家自然科学基金

3+阅读 · 2014年12月31日

面向三维服装建模的形状分析与处理方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

超光谱、全偏振、立体形貌的多模态成像研究

国家自然科学基金

0+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员