HiSync: Spatio-Temporally Aligning Hand Motion from Wearable IMU and On-Robot Camera for Command Source Identification in Long-Range HRI - 专知论文

会员服务 ·

0

远距离 · 对齐 · 交互 · 识别 · 模态 ·

HiSync: Spatio-Temporally Aligning Hand Motion from Wearable IMU and On-Robot Camera for Command Source Identification in Long-Range HRI

翻译：HiSync：通过可穿戴IMU与机器人摄像头的手部运动时空对齐实现远距离人机交互中的指令源识别

Chengwen Zhang,Chun Yu,Borong Zhuang,Haopeng Jin,Qingyang Wan,Zhuojun Li,Zhe He,Zhoutong Ye,Yu Mei,Chang Liu,Weinan Shi,Yuanchun Shi

Long-range Human-Robot Interaction (HRI) remains underexplored. Within it, Command Source Identification (CSI) - determining who issued a command - is especially challenging due to multi-user and distance-induced sensor ambiguity. We introduce HiSync, an optical-inertial fusion framework that treats hand motion as binding cues by aligning robot-mounted camera optical flow with hand-worn IMU signals. We first elicit a user-defined (N=12) gesture set and collect a multimodal command gesture dataset (N=38) in long-range multi-user HRI scenarios. Next, HiSync extracts frequency-domain hand motion features from both camera and IMU data, and a learned CSINet denoises IMU readings, temporally aligns modalities, and performs distance-aware multi-window fusion to compute cross-modal similarity of subtle, natural gestures, enabling robust CSI. In three-person scenes up to 34m, HiSync achieves 92.32% CSI accuracy, outperforming the prior SOTA by 48.44%. HiSync is also validated on real-robot deployment. By making CSI reliable and natural, HiSync provides a practical primitive and design guidance for public-space HRI.

翻译：远距离人机交互（HRI）领域的研究仍不充分。其中，指令源识别（CSI）——即确定指令发出者——由于多用户参与及距离导致的传感器模糊性而尤为困难。本文提出HiSync，一种光惯融合框架，通过将机器人搭载摄像头的光流与手部佩戴的惯性测量单元（IMU）信号进行对齐，将手部运动作为绑定线索。我们首先征集了一套用户自定义（N=12）手势集，并在远距离多用户HRI场景中收集了一个多模态指令手势数据集（N=38）。随后，HiSync从摄像头和IMU数据中提取频域手部运动特征，并通过学习的CSINet对IMU读数进行去噪、对多模态数据进行时间对齐，并执行距离感知的多窗口融合，以计算细微自然手势的跨模态相似度，从而实现鲁棒的CSI。在距离达34米的三用户场景中，HiSync实现了92.32%的CSI准确率，较先前最优方法提升48.44%。HiSync在真实机器人部署中也得到了验证。通过使CSI可靠且自然，HiSync为公共空间HRI提供了实用的基础组件与设计指导。

0

相关内容

远距离

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

专知会员服务

22+阅读 · 1月18日

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

专知会员服务

22+阅读 · 2025年11月2日

《军事远程操作中的自动语音识别与多模态交互技术》最新报告

《军事远程操作中的自动语音识别与多模态交互技术》最新报告

专知会员服务

25+阅读 · 2025年7月31日

利用人工智能提升战术级目标定位能力

利用人工智能提升战术级目标定位能力

专知会员服务

35+阅读 · 2024年12月4日

《用于军事行动实时三维场景分析的人工智能无人智能体》

《用于军事行动实时三维场景分析的人工智能无人智能体》

专知会员服务

66+阅读 · 2024年8月13日

面向虚实融合的人机交互

面向虚实融合的人机交互

专知会员服务

72+阅读 · 2023年6月25日

《基于边缘智能的可穿戴多模态手势识别》美空军2023最新38页报告

《基于边缘智能的可穿戴多模态手势识别》美空军2023最新38页报告

专知会员服务

49+阅读 · 2023年4月28日

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

专知会员服务

118+阅读 · 2022年6月20日

《多模态人机交互：基于语音和手势控制的开源驱动架构》2022年加拿大国防研究与发展部（DRDC）50页pdf

《多模态人机交互：基于语音和手势控制的开源驱动架构》2022年加拿大国防研究与发展部（DRDC）50页pdf

专知会员服务

54+阅读 · 2022年5月13日

【AI+军事】附论文《基于人工智能的“元素周期表”系统作为机器学习专家和军事操作员之间的有效沟通手段》

【AI+军事】附论文《基于人工智能的“元素周期表”系统作为机器学习专家和军事操作员之间的有效沟通手段》

专知会员服务

25+阅读 · 2022年5月5日

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

专知

59+阅读 · 2022年9月24日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

106+阅读 · 2022年4月28日

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

专知

17+阅读 · 2019年10月29日

【未来黑科技】深度玩转行人重识别与跨境追踪

【未来黑科技】深度玩转行人重识别与跨境追踪

炼数成金订阅号

11+阅读 · 2019年4月18日

【斯坦福李飞飞等人Nature论文】基于深度学习检测ICU中的患者移动

【斯坦福李飞飞等人Nature论文】基于深度学习检测ICU中的患者移动

专知

20+阅读 · 2019年3月2日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

北大新技术：利用WiFi设备进行人体行为识别！

北大新技术：利用WiFi设备进行人体行为识别！

全球人工智能

12+阅读 · 2018年2月7日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

干货｜基于双流递归神经网络的人体骨架行为识别！

干货｜基于双流递归神经网络的人体骨架行为识别！

全球人工智能

13+阅读 · 2017年12月15日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

基于增强现实的主从遥操作手术机器人系统中的力反馈问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

基于深度神经网络的雷达目标高分辨距离像稳健识别方法

国家自然科学基金

6+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于群智感知的非约束智能手机室内融合定位方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

27+阅读 · 2011年12月31日

UniMotion: Self-Supervised Learning for Cross-Domain IMU Motion Recognition

Arxiv

0+阅读 · 3月12日

Task-Oriented Robot-Human Handovers on Legged Manipulators

Arxiv

0+阅读 · 3月9日

SIAgent: Spatial Interaction Agent via LLM-powered Eye-Hand Motion Intent Understanding in VR

Arxiv

0+阅读 · 2月28日

CLOT: Closed-Loop Global Motion Tracking for Whole-Body Humanoid Teleoperation

Arxiv

0+阅读 · 2月20日

Replanning Human-Robot Collaborative Tasks with Vision-Language Models via Semantic and Physical Dual-Correction

Arxiv

0+阅读 · 2月16日

Hierarchical Audio-Visual-Proprioceptive Fusion for Precise Robotic Manipulation

Arxiv

0+阅读 · 2月14日

HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model

Arxiv

0+阅读 · 2月12日

Simultaneous Tactile-Visual Perception for Learning Multimodal Robot Manipulation

Arxiv

0+阅读 · 2月9日

Task-Oriented Robot-Human Handovers on Legged Manipulators

Arxiv

0+阅读 · 2月5日

CMD-HAR: Cross-Modal Disentanglement for Wearable Human Activity Recognition

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

1+阅读 · 13分钟前

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

1+阅读 · 16分钟前

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

1+阅读 · 24分钟前

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

3+阅读 · 4月30日

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

4+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

6+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

5+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

5+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

8+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

11+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

7+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

18+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

10+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

相关VIP内容

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

专知会员服务

22+阅读 · 1月18日

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

专知会员服务

22+阅读 · 2025年11月2日

《军事远程操作中的自动语音识别与多模态交互技术》最新报告

《军事远程操作中的自动语音识别与多模态交互技术》最新报告

专知会员服务

25+阅读 · 2025年7月31日

利用人工智能提升战术级目标定位能力

利用人工智能提升战术级目标定位能力

专知会员服务

35+阅读 · 2024年12月4日

《用于军事行动实时三维场景分析的人工智能无人智能体》

《用于军事行动实时三维场景分析的人工智能无人智能体》

专知会员服务

66+阅读 · 2024年8月13日

面向虚实融合的人机交互

面向虚实融合的人机交互

专知会员服务

72+阅读 · 2023年6月25日

《基于边缘智能的可穿戴多模态手势识别》美空军2023最新38页报告

《基于边缘智能的可穿戴多模态手势识别》美空军2023最新38页报告

专知会员服务

49+阅读 · 2023年4月28日

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

专知会员服务

118+阅读 · 2022年6月20日

《多模态人机交互：基于语音和手势控制的开源驱动架构》2022年加拿大国防研究与发展部（DRDC）50页pdf

《多模态人机交互：基于语音和手势控制的开源驱动架构》2022年加拿大国防研究与发展部（DRDC）50页pdf

专知会员服务

54+阅读 · 2022年5月13日

【AI+军事】附论文《基于人工智能的“元素周期表”系统作为机器学习专家和军事操作员之间的有效沟通手段》

【AI+军事】附论文《基于人工智能的“元素周期表”系统作为机器学习专家和军事操作员之间的有效沟通手段》

专知会员服务

25+阅读 · 2022年5月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能在全球军事与武器工业中的应用、方法论与影响》

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

相关资讯

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

推荐！【美国陆军战略项目年度报告】《人工智能（AI）用于多域作战（MDO）的指挥和控制（C2）》完整译文，美国陆军研究实验室

专知

59+阅读 · 2022年9月24日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

106+阅读 · 2022年4月28日

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

专知

17+阅读 · 2019年10月29日

【未来黑科技】深度玩转行人重识别与跨境追踪

【未来黑科技】深度玩转行人重识别与跨境追踪

炼数成金订阅号

11+阅读 · 2019年4月18日

【斯坦福李飞飞等人Nature论文】基于深度学习检测ICU中的患者移动

【斯坦福李飞飞等人Nature论文】基于深度学习检测ICU中的患者移动

专知

20+阅读 · 2019年3月2日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

北大新技术：利用WiFi设备进行人体行为识别！

北大新技术：利用WiFi设备进行人体行为识别！

全球人工智能

12+阅读 · 2018年2月7日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

干货｜基于双流递归神经网络的人体骨架行为识别！

干货｜基于双流递归神经网络的人体骨架行为识别！

全球人工智能

13+阅读 · 2017年12月15日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

相关论文

UniMotion: Self-Supervised Learning for Cross-Domain IMU Motion Recognition

Arxiv

0+阅读 · 3月12日

Task-Oriented Robot-Human Handovers on Legged Manipulators

Arxiv

0+阅读 · 3月9日

SIAgent: Spatial Interaction Agent via LLM-powered Eye-Hand Motion Intent Understanding in VR

Arxiv

0+阅读 · 2月28日

CLOT: Closed-Loop Global Motion Tracking for Whole-Body Humanoid Teleoperation

Arxiv

0+阅读 · 2月20日

Replanning Human-Robot Collaborative Tasks with Vision-Language Models via Semantic and Physical Dual-Correction

Arxiv

0+阅读 · 2月16日

Hierarchical Audio-Visual-Proprioceptive Fusion for Precise Robotic Manipulation

Arxiv

0+阅读 · 2月14日

HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model

Arxiv

0+阅读 · 2月12日

Simultaneous Tactile-Visual Perception for Learning Multimodal Robot Manipulation

Arxiv

0+阅读 · 2月9日

Task-Oriented Robot-Human Handovers on Legged Manipulators

Arxiv

0+阅读 · 2月5日

CMD-HAR: Cross-Modal Disentanglement for Wearable Human Activity Recognition

Arxiv

0+阅读 · 2月5日

相关基金

基于增强现实的主从遥操作手术机器人系统中的力反馈问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

基于深度神经网络的雷达目标高分辨距离像稳健识别方法

国家自然科学基金

6+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于群智感知的非约束智能手机室内融合定位方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

27+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员