VividFace：面向仿人机器人的实时逼真面部表情模仿系统 (VividFace: Real-Time and Realistic Facial Expression Shadowing for Humanoid Robots) - 专知论文

会员服务 ·

0

仿人 · 仿人机器人 · 系统 · 机器人 · 视频 ·

VividFace: Real-Time and Realistic Facial Expression Shadowing for Humanoid Robots

翻译：VividFace：面向仿人机器人的实时逼真面部表情模仿系统

Peizhen Li,Longbing Cao,Xiao-Ming Wu,Yang Zhang

from arxiv, Accepted to the 2026 IEEE International Conference on Robotics and Automation (ICRA)

Humanoid facial expression shadowing enables robots to realistically imitate human facial expressions in real time, which is critical for lifelike, facially expressive humanoid robots and affective human-robot interaction. Existing progress in humanoid facial expression imitation remains limited, often failing to achieve either real-time performance or realistic expressiveness due to offline video-based inference designs and insufficient ability to capture and transfer subtle expression details. To address these limitations, we present VividFace, a real-time and realistic facial expression shadowing system for humanoid robots. An optimized imitation framework X2CNet++ enhances expressiveness by fine-tuning the human-to-humanoid facial motion transfer module and introducing a feature-adaptation training strategy for better alignment across different image sources. Real-time shadowing is further enabled by a video-stream-compatible inference pipeline and a streamlined workflow based on asynchronous I/O for efficient communication across devices. VividFace produces vivid humanoid faces by mimicking human facial expressions within 0.05 seconds, while generalizing across diverse facial configurations. Extensive real-world demonstrations validate its practical utility. Videos are available at: https://lipzh5.github.io/VividFace/.

翻译：仿人机器人面部表情模仿使机器人能够实时逼真地模仿人类面部表情，这对于实现栩栩如生、具有丰富面部表情的仿人机器人以及情感化人机交互至关重要。现有仿人机器人表情模仿研究仍存在局限，常因采用基于离线视频的推理设计及捕捉与迁移细微表情细节的能力不足，难以同时实现实时性能与逼真表现力。为突破这些限制，我们提出了VividFace——一种面向仿人机器人的实时逼真面部表情模仿系统。优化的模仿框架X2CNet++通过微调人-仿人机器人面部运动迁移模块，并引入特征自适应训练策略以提升跨图像源的对齐能力，从而增强表情表现力。系统通过兼容视频流的推理管道与基于异步I/O的简化工作流程实现跨设备高效通信，进一步保障实时模仿性能。VividFace可在0.05秒内通过模仿人类面部表情生成生动的仿人机器人面部图像，并具备跨多样化面部构型的泛化能力。大量实际场景演示验证了其实际应用价值。演示视频详见：https://lipzh5.github.io/VividFace/。

0

相关内容

构建具身智能新范式：人形机器人技术现状及发展趋势综述

构建具身智能新范式：人形机器人技术现状及发展趋势综述

专知会员服务

27+阅读 · 2025年5月12日

人形机器人行业深度报告（一）：集技术大成之手，可否重塑未来？

人形机器人行业深度报告（一）：集技术大成之手，可否重塑未来？

专知会员服务

12+阅读 · 2025年4月21日

人形机器人行业2025年度策略：从科幻到现实，人形机器人进入量产元年

人形机器人行业2025年度策略：从科幻到现实，人形机器人进入量产元年

专知会员服务

32+阅读 · 2024年12月18日

人形机器人深度：产业化渐行渐近，未来前景广阔

人形机器人深度：产业化渐行渐近，未来前景广阔

专知会员服务

39+阅读 · 2024年7月17日

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

专知会员服务

45+阅读 · 2024年3月12日

人形机器人发展与展望

人形机器人发展与展望

专知会员服务

49+阅读 · 2023年9月6日

虚拟人行业深度报告：AI驱动虚拟人产业升级，应用场景进一步拓展

虚拟人行业深度报告：AI驱动虚拟人产业升级，应用场景进一步拓展

专知会员服务

50+阅读 · 2023年7月1日

面向虚实融合的人机交互

面向虚实融合的人机交互

专知会员服务

71+阅读 · 2023年6月25日

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

专知会员服务

21+阅读 · 2022年3月22日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

CVPR2020 | 大规模人脸表情识别（附源代码）

CVPR2020 | 大规模人脸表情识别（附源代码）

计算机视觉战队

12+阅读 · 2020年10月7日

论文盘点：人脸表情识别解析

论文盘点：人脸表情识别解析

PaperWeekly

13+阅读 · 2020年7月26日

SMP 2019 第三届中文人机对话技术评测顺利落幕

SMP 2019 第三届中文人机对话技术评测顺利落幕

哈工大SCIR

12+阅读 · 2019年8月19日

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频

智东西

10+阅读 · 2019年7月23日

计算机视觉方向简介 | 人脸表情识别

计算机视觉方向简介 | 人脸表情识别

计算机视觉life

36+阅读 · 2019年5月15日

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

专知

14+阅读 · 2019年4月17日

机器人也能拥有人类情感：“情感计算”让机器人学会“读心术”

机器人也能拥有人类情感：“情感计算”让机器人学会“读心术”

人工智能学家

11+阅读 · 2018年5月5日

人脸表情分类与识别：人脸检测+情绪分类

人脸表情分类与识别：人脸检测+情绪分类

北京思腾合力科技有限公司

27+阅读 · 2017年12月18日

keras实战︱人脸表情分类与识别：人脸检测+情绪分类

keras实战︱人脸表情分类与识别：人脸检测+情绪分类

数据挖掘入门与实战

21+阅读 · 2017年12月16日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于模块结合面微观接触机理的模块化机器人动态特性分析与研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合认知机理的概率图模型表情识别方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model

Arxiv

0+阅读 · 2月12日

GenFaceUI: Meta-Design of Generative Personalized Facial Expression Interfaces for Intelligent Agents

Arxiv

0+阅读 · 2月11日

3DXTalker: Unifying Identity, Lip Sync, Emotion, and Spatial Dynamics in Expressive 3D Talking Avatars

Arxiv

0+阅读 · 2月11日

SceneSmith: Agentic Generation of Simulation-Ready Indoor Scenes

Arxiv

0+阅读 · 2月9日

AgenticLab: A Real-World Robot Agent Platform that Can See, Think, and Act

Arxiv

0+阅读 · 2月9日

Bridging Speech, Emotion, and Motion: a VLM-based Multimodal Edge-deployable Framework for Humanoid Robots

Arxiv

0+阅读 · 2月7日

Open-Vocabulary Functional 3D Human-Scene Interaction Generation

Arxiv

0+阅读 · 1月30日

FlashFace: Human Image Personalization with High-fidelity Identity Preservation

Arxiv

0+阅读 · 1月30日

Uncertainty-Aware 3D Emotional Talking Face Synthesis with Emotion Prior Distillation

Arxiv

0+阅读 · 1月27日

Generation of Real-time Robotic Emotional Expressions Learning from Human Demonstration in Mixed Reality

Arxiv

0+阅读 · 1月17日

VIP会员

文章信息

相关主题

仿人机器人

相关VIP内容

构建具身智能新范式：人形机器人技术现状及发展趋势综述

构建具身智能新范式：人形机器人技术现状及发展趋势综述

专知会员服务

27+阅读 · 2025年5月12日

人形机器人行业深度报告（一）：集技术大成之手，可否重塑未来？

人形机器人行业深度报告（一）：集技术大成之手，可否重塑未来？

专知会员服务

12+阅读 · 2025年4月21日

人形机器人行业2025年度策略：从科幻到现实，人形机器人进入量产元年

人形机器人行业2025年度策略：从科幻到现实，人形机器人进入量产元年

专知会员服务

32+阅读 · 2024年12月18日

人形机器人深度：产业化渐行渐近，未来前景广阔

人形机器人深度：产业化渐行渐近，未来前景广阔

专知会员服务

39+阅读 · 2024年7月17日

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

专知会员服务

45+阅读 · 2024年3月12日

人形机器人发展与展望

人形机器人发展与展望

专知会员服务

49+阅读 · 2023年9月6日

虚拟人行业深度报告：AI驱动虚拟人产业升级，应用场景进一步拓展

虚拟人行业深度报告：AI驱动虚拟人产业升级，应用场景进一步拓展

专知会员服务

50+阅读 · 2023年7月1日

面向虚实融合的人机交互

面向虚实融合的人机交互

专知会员服务

71+阅读 · 2023年6月25日

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

【MM 2021】基于Transformer的动态人脸表情识别网络,Former-DFER: Dynamic Facial Expression Recognition Transformer

专知会员服务

21+阅读 · 2022年3月22日

【CVPR2021】MagFace:一种用于人脸识别和质量评估的通用表示

专知会员服务

29+阅读 · 2021年5月26日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

CVPR2020 | 大规模人脸表情识别（附源代码）

CVPR2020 | 大规模人脸表情识别（附源代码）

计算机视觉战队

12+阅读 · 2020年10月7日

论文盘点：人脸表情识别解析

论文盘点：人脸表情识别解析

PaperWeekly

13+阅读 · 2020年7月26日

SMP 2019 第三届中文人机对话技术评测顺利落幕

SMP 2019 第三届中文人机对话技术评测顺利落幕

哈工大SCIR

12+阅读 · 2019年8月19日

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频

智东西

10+阅读 · 2019年7月23日

计算机视觉方向简介 | 人脸表情识别

计算机视觉方向简介 | 人脸表情识别

计算机视觉life

36+阅读 · 2019年5月15日

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

【资源推荐】人脸技术相关资源汇总（识别、检测、标定、重建、生成等）

专知

14+阅读 · 2019年4月17日

机器人也能拥有人类情感：“情感计算”让机器人学会“读心术”

机器人也能拥有人类情感：“情感计算”让机器人学会“读心术”

人工智能学家

11+阅读 · 2018年5月5日

人脸表情分类与识别：人脸检测+情绪分类

人脸表情分类与识别：人脸检测+情绪分类

北京思腾合力科技有限公司

27+阅读 · 2017年12月18日

keras实战︱人脸表情分类与识别：人脸检测+情绪分类

keras实战︱人脸表情分类与识别：人脸检测+情绪分类

数据挖掘入门与实战

21+阅读 · 2017年12月16日

相关论文

HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model

Arxiv

0+阅读 · 2月12日

GenFaceUI: Meta-Design of Generative Personalized Facial Expression Interfaces for Intelligent Agents

Arxiv

0+阅读 · 2月11日

3DXTalker: Unifying Identity, Lip Sync, Emotion, and Spatial Dynamics in Expressive 3D Talking Avatars

Arxiv

0+阅读 · 2月11日

SceneSmith: Agentic Generation of Simulation-Ready Indoor Scenes

Arxiv

0+阅读 · 2月9日

AgenticLab: A Real-World Robot Agent Platform that Can See, Think, and Act

Arxiv

0+阅读 · 2月9日

Bridging Speech, Emotion, and Motion: a VLM-based Multimodal Edge-deployable Framework for Humanoid Robots

Arxiv

0+阅读 · 2月7日

Open-Vocabulary Functional 3D Human-Scene Interaction Generation

Arxiv

0+阅读 · 1月30日

FlashFace: Human Image Personalization with High-fidelity Identity Preservation

Arxiv

0+阅读 · 1月30日

Uncertainty-Aware 3D Emotional Talking Face Synthesis with Emotion Prior Distillation

Arxiv

0+阅读 · 1月27日

Generation of Real-time Robotic Emotional Expressions Learning from Human Demonstration in Mixed Reality

Arxiv

0+阅读 · 1月17日

相关基金

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于模块结合面微观接触机理的模块化机器人动态特性分析与研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合认知机理的概率图模型表情识别方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员