GraphiContact: Pose-aware Human-Scene Robust Contact Perception for Interactive Systems - 专知论文

会员服务 ·

0

重建 · 交互 · 系统 · 稳健 · 网格 ·

GraphiContact: Pose-aware Human-Scene Robust Contact Perception for Interactive Systems

翻译：GraphiContact：面向交互系统的姿态感知人体-场景稳健接触感知

Xiaojian Lin,Yaomin Shen,Junyuan Ma,Yujie Sun,Chengqing Bu,Wenxin Zhang,Zongzheng Zhang,Hao Fei,Lei Jin,Hao Zhao

from arxiv, 15 pages, 9 figures, Accepted at ICME 2026

Monocular vertex-level human-scene contact prediction is a fundamental capability for interactive systems such as assistive monitoring, embodied AI, and rehabilitation analysis. In this work, we study this task jointly with single-image 3D human mesh reconstruction, using reconstructed body geometry as a scaffold for contact reasoning. Existing approaches either focus on contact prediction without sufficiently exploiting explicit 3D human priors, or emphasize pose/mesh reconstruction without directly optimizing robust vertex-level contact inference under occlusion and perceptual noise. To address this gap, we propose GraphiContact, a pose-aware framework that transfers complementary human priors from two pretrained Transformer encoders and predicts per-vertex human-scene contact on the reconstructed mesh. To improve robustness in real-world scenarios, we further introduce a Single-Image Multi-Infer Uncertainty (SIMU) training strategy with token-level adaptive routing, which simulates occlusion and noisy observations during training while preserving efficient single-branch inference at test time. Experiments on five benchmark datasets show that GraphiContact achieves consistent gains on both contact prediction and 3D human reconstruction. Our code, based on the GraphiContact method, provides comprehensive 3D human reconstruction and interaction analysis, and will be publicly available at https://github.com/Aveiro-Lin/GraphiContact.

翻译：单目顶点级人体-场景接触预测是辅助监控、具身智能及康复分析等交互系统的核心能力。本文联合研究该任务与单图像三维人体网格重建，以重建的体态几何作为接触推理的支撑框架。现有方法或未充分挖掘显式三维人体先验进行接触预测，或侧重姿态/网格重建而缺乏对遮挡及感知噪声下稳健顶点级接触推理的直接优化。为弥补这一不足，我们提出GraphiContact——一种姿态感知框架，该框架从两个预训练Transformer编码器中迁移互补的人体先验，并在重建网格上逐顶点预测人体-场景接触。为提升真实场景的鲁棒性，我们进一步引入带令牌级自适应路由的单图像多推断不确定性训练策略：该策略在训练时模拟遮挡与噪声观测，同时保持测试阶段高效的单分支推理。在五个基准数据集上的实验表明，GraphiContact在接触预测和三维人体重建任务上均取得一致性提升。基于GraphiContact方法的代码提供了完整的三维人体重建与交互分析功能，将开源发布于https://github.com/Aveiro-Lin/GraphiContact。

0

相关内容

《基于人工智能与多模态系统的态势感知：架构、挑战与应用》最新41页综述

《基于人工智能与多模态系统的态势感知：架构、挑战与应用》最新41页综述

专知会员服务

61+阅读 · 2025年7月23日

基于人机智能融合技术的态势感知应用研究

基于人机智能融合技术的态势感知应用研究

专知会员服务

96+阅读 · 2024年2月11日

多模态人机交互综述

多模态人机交互综述

专知会员服务

150+阅读 · 2022年7月3日

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

专知会员服务

53+阅读 · 2022年4月30日

南大清华发布《从单目图像中恢复三维人体网格》综述论文，涵盖246篇文献全年阐述单目3D人体网格恢复研究进展

南大清华发布《从单目图像中恢复三维人体网格》综述论文，涵盖246篇文献全年阐述单目3D人体网格恢复研究进展

专知会员服务

33+阅读 · 2022年3月21日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

专知会员服务

30+阅读 · 2022年3月8日

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

专知会员服务

29+阅读 · 2020年4月5日

【CCF优秀博士学位论文奖-2019初评】面向健康的非干预式体征感知关键技术研究，西北工业大学王天本

【CCF优秀博士学位论文奖-2019初评】面向健康的非干预式体征感知关键技术研究，西北工业大学王天本

专知会员服务

30+阅读 · 2019年11月8日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

计算机视觉方向简介 | 人体姿态估计

计算机视觉方向简介 | 人体姿态估计

计算机视觉life

28+阅读 · 2019年6月6日

计算机视觉方向简介 | 人脸表情识别

计算机视觉方向简介 | 人脸表情识别

计算机视觉life

36+阅读 · 2019年5月15日

PFLD：简单高效的实用人脸关键点检测算法

PFLD：简单高效的实用人脸关键点检测算法

PaperWeekly

20+阅读 · 2019年4月17日

SkeletonNet：完整的人体三维位姿重建方法

SkeletonNet：完整的人体三维位姿重建方法

计算机视觉life

21+阅读 · 2019年1月21日

基于人体骨架的行为识别【附PPT与视频资料】

基于人体骨架的行为识别【附PPT与视频资料】

人工智能前沿讲习班

31+阅读 · 2019年1月15日

【团队新作】连续情感识别，精准捕捉你的小情绪！

【团队新作】连续情感识别，精准捕捉你的小情绪！

中国科学院自动化研究所

16+阅读 · 2018年4月17日

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

极市平台

12+阅读 · 2018年2月2日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

InHabit: Leveraging Image Foundation Models for Scalable 3D Human Placement

Arxiv

0+阅读 · 4月21日

PointTPA: Dynamic Network Parameter Adaptation for 3D Scene Understanding

Arxiv

0+阅读 · 4月6日

Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching

Arxiv

0+阅读 · 3月30日

Proprioceptive Image: An Image Representation of Proprioceptive Data from Quadruped Robots for Contact Estimation Learning

Arxiv

0+阅读 · 3月26日

HyperMotionX: The Dataset and Benchmark with DiT-Based Pose-Guided Human Image Animation of Complex Motions

Arxiv

0+阅读 · 3月18日

MessyKitchens: Contact-rich object-level 3D scene reconstruction

Arxiv

0+阅读 · 3月17日

InterDeepResearch: Enabling Human-Agent Collaborative Information Seeking through Interactive Deep Research

Arxiv

0+阅读 · 3月13日

SIMSPINE: A Biomechanics-Aware Simulation Framework for 3D Spine Motion Annotation and Benchmarking

Arxiv

0+阅读 · 3月11日

Monocular 3D Object Position Estimation with VLMs for Human-Robot Interaction

Arxiv

0+阅读 · 3月1日

GOT-Edit: Geometry-Aware Generic Object Tracking via Online Model Editing

Arxiv

0+阅读 · 2月23日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

2+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

4+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

5+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

6+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

15+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

《基于人工智能与多模态系统的态势感知：架构、挑战与应用》最新41页综述

《基于人工智能与多模态系统的态势感知：架构、挑战与应用》最新41页综述

专知会员服务

61+阅读 · 2025年7月23日

基于人机智能融合技术的态势感知应用研究

基于人机智能融合技术的态势感知应用研究

专知会员服务

96+阅读 · 2024年2月11日

多模态人机交互综述

多模态人机交互综述

专知会员服务

150+阅读 · 2022年7月3日

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

《人工智能之人机交互》报告重磅发布，展示AI+人机交互的酷炫现状与未来

专知会员服务

53+阅读 · 2022年4月30日

南大清华发布《从单目图像中恢复三维人体网格》综述论文，涵盖246篇文献全年阐述单目3D人体网格恢复研究进展

南大清华发布《从单目图像中恢复三维人体网格》综述论文，涵盖246篇文献全年阐述单目3D人体网格恢复研究进展

专知会员服务

33+阅读 · 2022年3月21日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

【吉林大学等】三维人体运动预测研究综述，3D Human Motion Prediction : A Survey

专知会员服务

30+阅读 · 2022年3月8日

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

专知会员服务

29+阅读 · 2020年4月5日

【CCF优秀博士学位论文奖-2019初评】面向健康的非干预式体征感知关键技术研究，西北工业大学王天本

【CCF优秀博士学位论文奖-2019初评】面向健康的非干预式体征感知关键技术研究，西北工业大学王天本

专知会员服务

30+阅读 · 2019年11月8日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

计算机视觉方向简介 | 人体姿态估计

计算机视觉方向简介 | 人体姿态估计

计算机视觉life

28+阅读 · 2019年6月6日

计算机视觉方向简介 | 人脸表情识别

计算机视觉方向简介 | 人脸表情识别

计算机视觉life

36+阅读 · 2019年5月15日

PFLD：简单高效的实用人脸关键点检测算法

PFLD：简单高效的实用人脸关键点检测算法

PaperWeekly

20+阅读 · 2019年4月17日

SkeletonNet：完整的人体三维位姿重建方法

SkeletonNet：完整的人体三维位姿重建方法

计算机视觉life

21+阅读 · 2019年1月21日

基于人体骨架的行为识别【附PPT与视频资料】

基于人体骨架的行为识别【附PPT与视频资料】

人工智能前沿讲习班

31+阅读 · 2019年1月15日

【团队新作】连续情感识别，精准捕捉你的小情绪！

【团队新作】连续情感识别，精准捕捉你的小情绪！

中国科学院自动化研究所

16+阅读 · 2018年4月17日

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

极市平台

12+阅读 · 2018年2月2日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

相关论文

InHabit: Leveraging Image Foundation Models for Scalable 3D Human Placement

Arxiv

0+阅读 · 4月21日

PointTPA: Dynamic Network Parameter Adaptation for 3D Scene Understanding

Arxiv

0+阅读 · 4月6日

Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching

Arxiv

0+阅读 · 3月30日

Proprioceptive Image: An Image Representation of Proprioceptive Data from Quadruped Robots for Contact Estimation Learning

Arxiv

0+阅读 · 3月26日

HyperMotionX: The Dataset and Benchmark with DiT-Based Pose-Guided Human Image Animation of Complex Motions

Arxiv

0+阅读 · 3月18日

MessyKitchens: Contact-rich object-level 3D scene reconstruction

Arxiv

0+阅读 · 3月17日

InterDeepResearch: Enabling Human-Agent Collaborative Information Seeking through Interactive Deep Research

Arxiv

0+阅读 · 3月13日

SIMSPINE: A Biomechanics-Aware Simulation Framework for 3D Spine Motion Annotation and Benchmarking

Arxiv

0+阅读 · 3月11日

Monocular 3D Object Position Estimation with VLMs for Human-Robot Interaction

Arxiv

0+阅读 · 3月1日

GOT-Edit: Geometry-Aware Generic Object Tracking via Online Model Editing

Arxiv

0+阅读 · 2月23日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

定位系统细胞启发的机器人情景认知地图构建与行为规划研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员