Are Pose Estimators Ready for the Open World? STAGE: A GenAI Toolkit for Auditing 3D Human Pose Estimators - 专知论文

会员服务 ·

0

姿态估计 · 人体姿态 · 人体姿态估计 · 工具 · 基准 ·

Are Pose Estimators Ready for the Open World? STAGE: A GenAI Toolkit for Auditing 3D Human Pose Estimators

翻译：三维人体姿态估计器是否已为开放世界做好准备？STAGE：用于审计三维人体姿态估计器的生成式人工智能工具包

Nikita Kister,István Sárándi,Jiayi Wang,Anna Khoreva,Gerard Pons-Moll

from arxiv, International Conference on 3D Vision 2026(3DV 2026)

For safety-critical applications, it is crucial to audit 3D human pose estimators before deployment. Will the system break down if the weather or the clothing changes? Is it robust regarding gender and age? To answer these questions and more, we need controlled studies with images that differ in a single attribute, but real benchmarks cannot provide such pairs. We thus present STAGE, a GenAI data toolkit for auditing 3D human pose estimators. For STAGE, we develop the first GenAI image creator with accurate 3D pose control and propose a novel evaluation strategy to isolate and quantify the effects of single factors such as gender, ethnicity, age, clothing, location, and weather. Enabled by STAGE, we generate a series of benchmarks to audit, for the first time, the sensitivity of popular pose estimators towards such factors. Our results show that natural variations can severely degrade pose estimator performance, raising doubts about their readiness for open-world deployment. We aim to highlight these robustness issues and establish STAGE as a benchmark to quantify them.

翻译：在安全关键应用中，部署前对三维人体姿态估计器进行审计至关重要。若天气或衣着发生变化，系统是否会失效？其对于性别与年龄是否具备鲁棒性？为回答这些问题及其他相关疑问，我们需要基于单一属性差异图像的受控研究，但现有真实基准无法提供此类配对数据。为此，我们提出STAGE——一个用于审计三维人体姿态估计器的生成式人工智能数据工具包。在STAGE中，我们开发了首个具备精确三维姿态控制能力的生成式人工智能图像生成器，并提出一种新颖的评估策略，以隔离并量化性别、种族、年龄、衣着、场景与天气等单一因素的影响。借助STAGE，我们生成了一系列基准测试，首次系统审计了主流姿态估计器对上述因素的敏感性。实验结果表明，自然场景的变异会严重降低姿态估计器的性能，这对其在开放世界部署的适用性提出了质疑。本研究旨在揭示这些鲁棒性问题，并将STAGE确立为量化此类问题的基准工具。

0

相关内容

姿态估计

迈向深度基础模型：基于视觉的深度估计最新趋势

迈向深度基础模型：基于视觉的深度估计最新趋势

专知会员服务

24+阅读 · 2025年7月16日

基于深度学习的物体姿态估计综述

基于深度学习的物体姿态估计综述

专知会员服务

27+阅读 · 2024年5月15日

《利用深度学习进行目标姿态估计》2023最新63页论文

《利用深度学习进行目标姿态估计》2023最新63页论文

专知会员服务

48+阅读 · 2023年8月29日

【AI+军事】附论文+PPT《多模态评估的用于认知工作量和训练的可穿戴式大脑和身体感应装置》

【AI+军事】附论文+PPT《多模态评估的用于认知工作量和训练的可穿戴式大脑和身体感应装置》

专知会员服务

38+阅读 · 2022年5月14日

【AI/脑机接口+军事】含论文+ppt《基于可穿戴大脑和身体传感的用于认知负荷和训练的多模态评估方法》，美国德雷塞尔大学、洛克希德马丁、宾夕法尼亚大学等

【AI/脑机接口+军事】含论文+ppt《基于可穿戴大脑和身体传感的用于认知负荷和训练的多模态评估方法》，美国德雷塞尔大学、洛克希德马丁、宾夕法尼亚大学等

专知会员服务

67+阅读 · 2022年4月7日

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

专知会员服务

30+阅读 · 2022年3月8日

ICCV 2021 | 半监督二维人体姿态估计中的模型坍塌问题研究（代码已开源）

专知会员服务

12+阅读 · 2021年10月1日

最新《深度学习人体姿态估计》综述论文，26页pdf

最新《深度学习人体姿态估计》综述论文，26页pdf

专知会员服务

41+阅读 · 2020年12月29日

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

专知会员服务

21+阅读 · 2020年6月13日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

94+阅读 · 2022年4月17日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

计算机视觉方向简介 | 人体姿态估计

计算机视觉方向简介 | 人体姿态估计

计算机视觉life

28+阅读 · 2019年6月6日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

25+阅读 · 2019年5月19日

使用双目相机进行三维重建第二部分：姿态估计

使用双目相机进行三维重建第二部分：姿态估计

AI研习社

12+阅读 · 2019年5月7日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

SkeletonNet：完整的人体三维位姿重建方法

SkeletonNet：完整的人体三维位姿重建方法

计算机视觉life

21+阅读 · 2019年1月21日

六种人体姿态估计的深度学习模型和代码总结

六种人体姿态估计的深度学习模型和代码总结

论智

19+阅读 · 2018年6月27日

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

极市平台

12+阅读 · 2018年2月2日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于多芯光纤的高精度三维姿态测量关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向高精度航天器状态估计系统的预测变结构滤波理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于状态空间的视觉伺服系统参数估计方法研究及应用

国家自然科学基金

1+阅读 · 2015年12月31日

非约束环境下的人脸图像预处理计算模型与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展状态观测器的不确定分数阶系统镇定设计

国家自然科学基金

0+阅读 · 2015年12月31日

移动与可穿戴计算中Eyes-Free交互界面研究

国家自然科学基金

0+阅读 · 2014年12月31日

ER-Pose: Rethinking Keypoint-Driven Representation Learning for Real-Time Human Pose Estimation

Arxiv

0+阅读 · 3月9日

EgoPoseFormer v2: Accurate Egocentric Human Motion Estimation for AR/VR

Arxiv

0+阅读 · 3月4日

Monocular 3D Object Position Estimation with VLMs for Human-Robot Interaction

Arxiv

0+阅读 · 3月1日

SEAL-pose: Enhancing 3D Human Pose Estimation via a Learned Loss for Structural Consistency

Arxiv

0+阅读 · 2月23日

Perception with Guarantees: Certified Pose Estimation via Reachability Analysis

Arxiv

0+阅读 · 2月10日

Benchmarking 3D Human Pose Estimation Models under Occlusions

Arxiv

0+阅读 · 2月10日

WiFlow: A Lightweight WiFi-based Continuous Human Pose Estimation Network with Spatio-Temporal Feature Decoupling

Arxiv

0+阅读 · 2月9日

Out of the box age estimation through facial imagery: A Comprehensive Benchmark of Vision-Language Models vs. out-of-the-box Traditional Architectures

Arxiv

0+阅读 · 2月8日

PoseGaussian: Pose-Driven Novel View Synthesis for Robust 3D Human Reconstruction

Arxiv

0+阅读 · 2月5日

Open-Vocabulary Functional 3D Human-Scene Interaction Generation

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

人体姿态估计

最新内容

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

8+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

3+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

7+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

6+阅读 · 7月22日

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

15+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

12+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

9+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

7+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

9+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

8+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

10+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

9+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

10+阅读 · 7月20日

相关VIP内容

迈向深度基础模型：基于视觉的深度估计最新趋势

迈向深度基础模型：基于视觉的深度估计最新趋势

专知会员服务

24+阅读 · 2025年7月16日

基于深度学习的物体姿态估计综述

基于深度学习的物体姿态估计综述

专知会员服务

27+阅读 · 2024年5月15日

《利用深度学习进行目标姿态估计》2023最新63页论文

《利用深度学习进行目标姿态估计》2023最新63页论文

专知会员服务

48+阅读 · 2023年8月29日

【AI+军事】附论文+PPT《多模态评估的用于认知工作量和训练的可穿戴式大脑和身体感应装置》

【AI+军事】附论文+PPT《多模态评估的用于认知工作量和训练的可穿戴式大脑和身体感应装置》

专知会员服务

38+阅读 · 2022年5月14日

【AI/脑机接口+军事】含论文+ppt《基于可穿戴大脑和身体传感的用于认知负荷和训练的多模态评估方法》，美国德雷塞尔大学、洛克希德马丁、宾夕法尼亚大学等

【AI/脑机接口+军事】含论文+ppt《基于可穿戴大脑和身体传感的用于认知负荷和训练的多模态评估方法》，美国德雷塞尔大学、洛克希德马丁、宾夕法尼亚大学等

专知会员服务

67+阅读 · 2022年4月7日

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

专知会员服务

30+阅读 · 2022年3月8日

ICCV 2021 | 半监督二维人体姿态估计中的模型坍塌问题研究（代码已开源）

专知会员服务

12+阅读 · 2021年10月1日

最新《深度学习人体姿态估计》综述论文，26页pdf

最新《深度学习人体姿态估计》综述论文，26页pdf

专知会员服务

41+阅读 · 2020年12月29日

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

专知会员服务

21+阅读 · 2020年6月13日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

对抗环境下超视距目标打击的情报支援

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

相关资讯

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

94+阅读 · 2022年4月17日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

计算机视觉方向简介 | 人体姿态估计

计算机视觉方向简介 | 人体姿态估计

计算机视觉life

28+阅读 · 2019年6月6日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

25+阅读 · 2019年5月19日

使用双目相机进行三维重建第二部分：姿态估计

使用双目相机进行三维重建第二部分：姿态估计

AI研习社

12+阅读 · 2019年5月7日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

SkeletonNet：完整的人体三维位姿重建方法

SkeletonNet：完整的人体三维位姿重建方法

计算机视觉life

21+阅读 · 2019年1月21日

六种人体姿态估计的深度学习模型和代码总结

六种人体姿态估计的深度学习模型和代码总结

论智

19+阅读 · 2018年6月27日

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

极市平台

12+阅读 · 2018年2月2日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

相关论文

ER-Pose: Rethinking Keypoint-Driven Representation Learning for Real-Time Human Pose Estimation

Arxiv

0+阅读 · 3月9日

EgoPoseFormer v2: Accurate Egocentric Human Motion Estimation for AR/VR

Arxiv

0+阅读 · 3月4日

Monocular 3D Object Position Estimation with VLMs for Human-Robot Interaction

Arxiv

0+阅读 · 3月1日

SEAL-pose: Enhancing 3D Human Pose Estimation via a Learned Loss for Structural Consistency

Arxiv

0+阅读 · 2月23日

Perception with Guarantees: Certified Pose Estimation via Reachability Analysis

Arxiv

0+阅读 · 2月10日

Benchmarking 3D Human Pose Estimation Models under Occlusions

Arxiv

0+阅读 · 2月10日

WiFlow: A Lightweight WiFi-based Continuous Human Pose Estimation Network with Spatio-Temporal Feature Decoupling

Arxiv

0+阅读 · 2月9日

Out of the box age estimation through facial imagery: A Comprehensive Benchmark of Vision-Language Models vs. out-of-the-box Traditional Architectures

Arxiv

0+阅读 · 2月8日

PoseGaussian: Pose-Driven Novel View Synthesis for Robust 3D Human Reconstruction

Arxiv

0+阅读 · 2月5日

Open-Vocabulary Functional 3D Human-Scene Interaction Generation

Arxiv

0+阅读 · 1月30日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于多芯光纤的高精度三维姿态测量关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向高精度航天器状态估计系统的预测变结构滤波理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于状态空间的视觉伺服系统参数估计方法研究及应用

国家自然科学基金

1+阅读 · 2015年12月31日

非约束环境下的人脸图像预处理计算模型与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展状态观测器的不确定分数阶系统镇定设计

国家自然科学基金

0+阅读 · 2015年12月31日

移动与可穿戴计算中Eyes-Free交互界面研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员