A Multimodal RGB and Events Dataset for Hand Detection in First-Person View - 专知论文

会员服务 ·

0

事件 · 数据集 · 多模 · 模态 · 事件相机 ·

A Multimodal RGB and Events Dataset for Hand Detection in First-Person View

翻译：面向第一人称视角手部检测的多模态RGB与事件数据集

Bharghav Kota,Yulia Sandamirskaya

Existing hand detection algorithms work on images and the detection rate is restricted by the frame rate of the camera. In hand detection applications for moving robotic systems, conventional cameras cause motion blur, especially in darker lighting conditions. We can leverage the use of event-based cameras which possess a high dynamic range, high temporal resolution, and low power consumption. Recent work has shown that using a stereo setup of an event-based and a frame-based camera improves detection accuracy and the bandwidth-latency tradeoff. The main bottleneck in using event-based cameras in object detection and recognition tasks is a relatively low amount of training data. In this work, we propose a methodology and an exemplary synthetic event-based hand dataset from an egocentric, first-person view perspective. The data is synthesized from the existing RGB Egohands dataset with the v2e toolbox. Parameters of the v2e toolbox are varied to provide versions of the dataset with different lighting conditions and scales. Ground truth detections are generated with a fine-tuned YOLOv8 model which is applied to the RGB images in the Egohands dataset and interpolated on the high-temporal resolution events. We use the multi-modal dataset to perform hand detection with existing object detection algorithms which use a multi-modal setup of event and RGB cameras and demonstrate performance comparable to the state-of-the-art.

翻译：现有手部检测算法基于图像工作，其检测率受限于相机的帧率。在移动机器人系统的手部检测应用中，传统相机会导致运动模糊，尤其在低光照条件下更为显著。事件相机凭借其高动态范围、高时间分辨率和低功耗特性，可有效应对这一挑战。最新研究表明，采用事件相机与帧式相机组成的立体装置，能够提升检测精度并优化带宽-延迟权衡。目前将事件相机应用于目标检测与识别任务的主要瓶颈在于训练数据相对匮乏。本文提出了一种方法论及从第一人称自我中心视角生成的合成事件手部数据集。该数据通过v2e工具箱从现有RGB Egohands数据集合成，通过调整v2e工具箱参数获得不同光照条件与尺度的数据集版本。真实标注检测结果由微调后的YOLOv8模型生成，该模型应用于Egohands数据集中的RGB图像，并通过插值方法映射到高时间分辨率的事件数据上。我们利用该多模态数据集，结合基于事件与RGB相机多模态配置的现有目标检测算法进行手部检测，实验结果表明其性能达到当前最优水平。

0

相关内容

综述：AI生成视频检测，从视觉取证走向事实保真验证

综述：AI生成视频检测，从视觉取证走向事实保真验证

专知会员服务

11+阅读 · 7月14日

【牛津大学博士论文】使用多模态学习的手语理解，259页pdf

【牛津大学博士论文】使用多模态学习的手语理解，259页pdf

专知会员服务

20+阅读 · 2024年9月14日

《基于边缘智能的可穿戴多模态手势识别》美空军2023最新38页报告

《基于边缘智能的可穿戴多模态手势识别》美空军2023最新38页报告

专知会员服务

50+阅读 · 2023年4月28日

【苏黎世联邦理工2022年博士论文】《视觉 SLAM 的事件驱动特征检测和跟踪》

【苏黎世联邦理工2022年博士论文】《视觉 SLAM 的事件驱动特征检测和跟踪》

专知会员服务

23+阅读 · 2022年8月11日

【AI+军事】附论文+PPT《多模态评估的用于认知工作量和训练的可穿戴式大脑和身体感应装置》

【AI+军事】附论文+PPT《多模态评估的用于认知工作量和训练的可穿戴式大脑和身体感应装置》

专知会员服务

38+阅读 · 2022年5月14日

【AI/脑机接口+军事】含论文+ppt《基于可穿戴大脑和身体传感的用于认知负荷和训练的多模态评估方法》，美国德雷塞尔大学、洛克希德马丁、宾夕法尼亚大学等

【AI/脑机接口+军事】含论文+ppt《基于可穿戴大脑和身体传感的用于认知负荷和训练的多模态评估方法》，美国德雷塞尔大学、洛克希德马丁、宾夕法尼亚大学等

专知会员服务

67+阅读 · 2022年4月7日

动态手势理解与交互综述

专知会员服务

34+阅读 · 2021年10月11日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

专知会员服务

21+阅读 · 2020年6月13日

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

专知会员服务

27+阅读 · 2020年1月17日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

Facebook Oculus实验室实习生：手势估计最新综述

Facebook Oculus实验室实习生：手势估计最新综述

专知

10+阅读 · 2019年3月12日

新型相机DVS/Event-based camera的发展及应用

新型相机DVS/Event-based camera的发展及应用

计算机视觉life

16+阅读 · 2019年3月12日

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

产业智能官

15+阅读 · 2019年2月1日

【深度】行人检测算法

【深度】行人检测算法

GAN生成式对抗网络

29+阅读 · 2018年6月3日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

机器之心

15+阅读 · 2018年3月11日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

2017-最全手势识别/跟踪相关资源大列表分享（论文、数据集、比赛等）

2017-最全手势识别/跟踪相关资源大列表分享（论文、数据集、比赛等）

深度学习与NLP

64+阅读 · 2017年10月29日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

基于多芯光纤的高精度三维姿态测量关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于RGB-D数据的个性化手势交互技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

复杂运动场景视频大数据中异常事件检测研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

基于多个小型微惯性/磁强计测量单元的手势识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于集成流形学习的监控视频中人体行为识别研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

Impact of Hand Impairment and Occlusions on Hand Pose Estimation Accuracy in Augmented Reality Applications

Arxiv

0+阅读 · 6月16日

FATE: Pillar Encoding and Frequency-Aware Training for Event-Based Object Detection

Arxiv

0+阅读 · 6月15日

VEPHand: View-Efficient Photometric Hand Performance Capture at Scale

Arxiv

0+阅读 · 6月14日

FEMOT: Multi-Object Tracking using Frame and Event Cameras

Arxiv

0+阅读 · 6月12日

Modular Anthropomorphic Hand Design via Multi-Parameter Finger Benchmarking and Selection

Arxiv

0+阅读 · 6月10日

Dense Force Estimation with an Event-based Optical Tactile Sensor

Arxiv

0+阅读 · 6月8日

COMPOSE: Hypergraph Cover Optimization for Multi-view 3D Human Pose Estimation

Arxiv

0+阅读 · 6月5日

Quantitative Movement Testing: Measuring Patient Movements from a Single Smartphone Video

Arxiv

0+阅读 · 6月1日

Event2Vec: Processing Neuromorphic Events Directly by Representations in Vector Space

Arxiv

0+阅读 · 6月1日

EgoEV-HandPose: Egocentric 3D Hand Pose Estimation and Gesture Recognition with Stereo Event Cameras

Arxiv

0+阅读 · 5月12日

VIP会员

文章信息

相关主题

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

7+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

2+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

6+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

8+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

3+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

7+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

5+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

5+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

5+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

3+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

12+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

9+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

10+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

6+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

9+阅读 · 7月31日

相关VIP内容

综述：AI生成视频检测，从视觉取证走向事实保真验证

综述：AI生成视频检测，从视觉取证走向事实保真验证

专知会员服务

11+阅读 · 7月14日

【牛津大学博士论文】使用多模态学习的手语理解，259页pdf

【牛津大学博士论文】使用多模态学习的手语理解，259页pdf

专知会员服务

20+阅读 · 2024年9月14日

《基于边缘智能的可穿戴多模态手势识别》美空军2023最新38页报告

《基于边缘智能的可穿戴多模态手势识别》美空军2023最新38页报告

专知会员服务

50+阅读 · 2023年4月28日

【苏黎世联邦理工2022年博士论文】《视觉 SLAM 的事件驱动特征检测和跟踪》

【苏黎世联邦理工2022年博士论文】《视觉 SLAM 的事件驱动特征检测和跟踪》

专知会员服务

23+阅读 · 2022年8月11日

【AI+军事】附论文+PPT《多模态评估的用于认知工作量和训练的可穿戴式大脑和身体感应装置》

【AI+军事】附论文+PPT《多模态评估的用于认知工作量和训练的可穿戴式大脑和身体感应装置》

专知会员服务

38+阅读 · 2022年5月14日

【AI/脑机接口+军事】含论文+ppt《基于可穿戴大脑和身体传感的用于认知负荷和训练的多模态评估方法》，美国德雷塞尔大学、洛克希德马丁、宾夕法尼亚大学等

【AI/脑机接口+军事】含论文+ppt《基于可穿戴大脑和身体传感的用于认知负荷和训练的多模态评估方法》，美国德雷塞尔大学、洛克希德马丁、宾夕法尼亚大学等

专知会员服务

67+阅读 · 2022年4月7日

动态手势理解与交互综述

专知会员服务

34+阅读 · 2021年10月11日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

专知会员服务

21+阅读 · 2020年6月13日

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

专知会员服务

27+阅读 · 2020年1月17日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

Facebook Oculus实验室实习生：手势估计最新综述

Facebook Oculus实验室实习生：手势估计最新综述

专知

10+阅读 · 2019年3月12日

新型相机DVS/Event-based camera的发展及应用

新型相机DVS/Event-based camera的发展及应用

计算机视觉life

16+阅读 · 2019年3月12日

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

产业智能官

15+阅读 · 2019年2月1日

【深度】行人检测算法

【深度】行人检测算法

GAN生成式对抗网络

29+阅读 · 2018年6月3日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

深度 | 级联MobileNet-V2实现人脸关键点检测（附训练源码）

机器之心

15+阅读 · 2018年3月11日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

2017-最全手势识别/跟踪相关资源大列表分享（论文、数据集、比赛等）

2017-最全手势识别/跟踪相关资源大列表分享（论文、数据集、比赛等）

深度学习与NLP

64+阅读 · 2017年10月29日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

相关论文

Impact of Hand Impairment and Occlusions on Hand Pose Estimation Accuracy in Augmented Reality Applications

Arxiv

0+阅读 · 6月16日

FATE: Pillar Encoding and Frequency-Aware Training for Event-Based Object Detection

Arxiv

0+阅读 · 6月15日

VEPHand: View-Efficient Photometric Hand Performance Capture at Scale

Arxiv

0+阅读 · 6月14日

FEMOT: Multi-Object Tracking using Frame and Event Cameras

Arxiv

0+阅读 · 6月12日

Modular Anthropomorphic Hand Design via Multi-Parameter Finger Benchmarking and Selection

Arxiv

0+阅读 · 6月10日

Dense Force Estimation with an Event-based Optical Tactile Sensor

Arxiv

0+阅读 · 6月8日

COMPOSE: Hypergraph Cover Optimization for Multi-view 3D Human Pose Estimation

Arxiv

0+阅读 · 6月5日

Quantitative Movement Testing: Measuring Patient Movements from a Single Smartphone Video

Arxiv

0+阅读 · 6月1日

Event2Vec: Processing Neuromorphic Events Directly by Representations in Vector Space

Arxiv

0+阅读 · 6月1日

EgoEV-HandPose: Egocentric 3D Hand Pose Estimation and Gesture Recognition with Stereo Event Cameras

Arxiv

0+阅读 · 5月12日

相关基金

基于多芯光纤的高精度三维姿态测量关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于RGB-D数据的个性化手势交互技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

复杂运动场景视频大数据中异常事件检测研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

基于多个小型微惯性/磁强计测量单元的手势识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于集成流形学习的监控视频中人体行为识别研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于深度信息和显著计算的手势交互技术研究及应用

国家自然科学基金

1+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员