基于低成本边缘硬件的实时车内驾驶员行为识别 (Real-Time In-Cabin Driver Behavior Recognition on Low-Cost Edge Hardware) - 专知论文

会员服务 ·

0

识别 · 系统 · 边缘 · 行为识别 · TPU ·

Real-Time In-Cabin Driver Behavior Recognition on Low-Cost Edge Hardware

翻译：基于低成本边缘硬件的实时车内驾驶员行为识别

Vesal Ahsani,Babak Hossein Khalaj,Hamed Shah-Mansouri

from arxiv, 27 pages, 6 figures, 5 tables

In-cabin driver monitoring systems (DMS) must recognize distraction- and drowsiness-related behaviors with low latency under strict constraints on compute, power, and cost. We present a single-camera in-cabin driver behavior recognition system designed for deployment on two low-cost edge platforms: Raspberry Pi 5 (CPU-only) and the Google Coral development board with an Edge Tensor Processing Unit (Edge TPU) accelerator. The proposed pipeline combines (i) a compact per-frame vision model, (ii) a confounder-aware label taxonomy to reduce confusions among visually similar behaviors, and (iii) a temporal decision head that triggers alerts only when predictions are both confident and sustained. The system supports 17 behavior classes. Training and evaluation use licensed datasets plus in-house collection (over 800,000 labeled frames) with driver-disjoint splits, and we further validate the deployed system in live in-vehicle tests. End-to-end performance reaches approximately 16 FPS on Raspberry Pi 5 using 8-bit integer (INT8) inference (per-frame latency <60 ms) and approximately 25 FPS on Coral Edge TPU (end-to-end latency ~40 ms), enabling real-time monitoring and stable alert generation on embedded hardware. Finally, we discuss how reliable in-cabin perception can serve as an upstream signal for human-centered vehicle intelligence, including emerging agentic vehicle concepts.

翻译：车内驾驶员监控系统（DMS）必须在计算能力、功耗和成本严格受限的条件下，以低延迟识别与分心和困倦相关的行为。我们提出了一种单摄像头车内驾驶员行为识别系统，专为在两种低成本边缘平台上部署而设计：Raspberry Pi 5（仅CPU）和搭载Edge Tensor Processing Unit（Edge TPU）加速器的Google Coral开发板。所提出的流程结合了（i）一个紧凑的逐帧视觉模型，（ii）一个用于减少视觉相似行为间混淆的混杂因素感知标签分类法，以及（iii）一个仅在预测结果既高置信又持续时才触发警报的时序决策头。该系统支持17种行为类别。训练和评估使用了授权数据集以及内部采集的数据（超过800,000个标注帧），并采用驾驶员不相交的数据划分。我们还在实车测试中进一步验证了部署系统的性能。端到端性能在Raspberry Pi 5上使用8位整数（INT8）推理时达到约16 FPS（逐帧延迟<60毫秒），在Coral Edge TPU上达到约25 FPS（端到端延迟约40毫秒），从而能够在嵌入式硬件上实现实时监控和稳定的警报生成。最后，我们讨论了可靠的车内感知如何作为以人为本的车辆智能（包括新兴的智能体化车辆概念）的上游信号。

0

相关内容

EdgeRunner AI：在本地设备关键军事任务中实现GPT-5级性能表现（附论文）

EdgeRunner AI：在本地设备关键军事任务中实现GPT-5级性能表现（附论文）

专知会员服务

26+阅读 · 2025年11月19日

基于脉冲神经网络的边缘智能

基于脉冲神经网络的边缘智能

专知会员服务

20+阅读 · 2025年7月23日

边缘AI行业深度：边缘AI硬件，引领硬件创新时代

边缘AI行业深度：边缘AI硬件，引领硬件创新时代

专知会员服务

51+阅读 · 2024年4月18日

《利用音频传感器网络检测、识别和跟踪无人机的时频协同方法》

《利用音频传感器网络检测、识别和跟踪无人机的时频协同方法》

专知会员服务

40+阅读 · 2023年9月11日

边缘智能如何用于车联网？车联网边缘智能：概念、架构、问题、实施和展望

边缘智能如何用于车联网？车联网边缘智能：概念、架构、问题、实施和展望

专知会员服务

40+阅读 · 2023年1月30日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【行业标准】基于车路协同的高等级自动驾驶数据交互内容，117页pdf

【行业标准】基于车路协同的高等级自动驾驶数据交互内容，117页pdf

专知会员服务

59+阅读 · 2022年3月16日

面向自动驾驶的边缘计算技术研究综述

专知会员服务

66+阅读 · 2021年5月3日

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

专知会员服务

19+阅读 · 2019年11月3日

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

专知会员服务

57+阅读 · 2019年10月22日

自动驾驶车辆定位技术概述｜厚势汽车

自动驾驶车辆定位技术概述｜厚势汽车

厚势

10+阅读 · 2019年5月16日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

无人驾驶开源仿真平台整理

无人驾驶开源仿真平台整理

智能交通技术

27+阅读 · 2019年5月9日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

中国自动化学会

15+阅读 · 2018年7月5日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

上汽乘用车：智能驾驶汽车传感器介绍及布置 | 厚势

上汽乘用车：智能驾驶汽车传感器介绍及布置 | 厚势

厚势

14+阅读 · 2018年1月19日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

面向车联网海量高速移动终端的高效信道信息获取机制

国家自然科学基金

0+阅读 · 2017年12月31日

基于时空模式的复杂行为识别方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

面向城市环境的车载机会网络关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

MRF模型的车载全景视觉位姿估计最优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于实时路况的乘用车经济环保出行路径规划方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于机器类型通信的车联网群组安全协议研究

国家自然科学基金

2+阅读 · 2015年12月31日

一种新型的基于行人检测与行走方向识别的辅助驾驶安全系统的设计与开发

国家自然科学基金

0+阅读 · 2014年12月31日

Realistic adversarial scenario generation via human-like pedestrian model for autonomous vehicle control parameter optimisation

Arxiv

0+阅读 · 2月4日

EgoFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving

Arxiv

0+阅读 · 2月2日

A Real-Time Privacy-Preserving Behavior Recognition System via Edge-Cloud Collaboration

Arxiv

0+阅读 · 1月30日

A Style-Based Profiling Framework for Quantifying the Synthetic-to-Real Gap in Autonomous Driving Datasets

Arxiv

0+阅读 · 1月26日

DMV-AVP: Distributed Multi-Vehicle Autonomous Valet Parking using Autoware

Arxiv

0+阅读 · 1月22日

Visual and Cognitive Demands of a Large Language Model-Powered In-vehicle Conversational Agent

Arxiv

0+阅读 · 1月21日

Vision-Language Models on the Edge for Real-Time Robotic Perception

Arxiv

0+阅读 · 1月21日

Zero-Shot Distracted Driver Detection via Vision Language Models with Double Decoupling

Arxiv

0+阅读 · 1月13日

Realistic adversarial scenario generation via human-like pedestrian model for autonomous vehicle control parameter optimisation

Arxiv

0+阅读 · 1月5日

Real-Time Lane Detection via Efficient Feature Alignment and Covariance Optimization for Low-Power Embedded Systems

Arxiv

0+阅读 · 1月5日

VIP会员

文章信息

相关主题

相关VIP内容

EdgeRunner AI：在本地设备关键军事任务中实现GPT-5级性能表现（附论文）

EdgeRunner AI：在本地设备关键军事任务中实现GPT-5级性能表现（附论文）

专知会员服务

26+阅读 · 2025年11月19日

基于脉冲神经网络的边缘智能

基于脉冲神经网络的边缘智能

专知会员服务

20+阅读 · 2025年7月23日

边缘AI行业深度：边缘AI硬件，引领硬件创新时代

边缘AI行业深度：边缘AI硬件，引领硬件创新时代

专知会员服务

51+阅读 · 2024年4月18日

《利用音频传感器网络检测、识别和跟踪无人机的时频协同方法》

《利用音频传感器网络检测、识别和跟踪无人机的时频协同方法》

专知会员服务

40+阅读 · 2023年9月11日

边缘智能如何用于车联网？车联网边缘智能：概念、架构、问题、实施和展望

边缘智能如何用于车联网？车联网边缘智能：概念、架构、问题、实施和展望

专知会员服务

40+阅读 · 2023年1月30日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【行业标准】基于车路协同的高等级自动驾驶数据交互内容，117页pdf

【行业标准】基于车路协同的高等级自动驾驶数据交互内容，117页pdf

专知会员服务

59+阅读 · 2022年3月16日

面向自动驾驶的边缘计算技术研究综述

专知会员服务

66+阅读 · 2021年5月3日

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

专知会员服务

19+阅读 · 2019年11月3日

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

城市大脑与边缘计算，特邀嘉宾中国工程院院士高文，第八届全国社会媒体处理大会SMP2019

专知会员服务

57+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

自动驾驶车辆定位技术概述｜厚势汽车

自动驾驶车辆定位技术概述｜厚势汽车

厚势

10+阅读 · 2019年5月16日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

无人驾驶开源仿真平台整理

无人驾驶开源仿真平台整理

智能交通技术

27+阅读 · 2019年5月9日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

中国自动化学会

15+阅读 · 2018年7月5日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

上汽乘用车：智能驾驶汽车传感器介绍及布置 | 厚势

上汽乘用车：智能驾驶汽车传感器介绍及布置 | 厚势

厚势

14+阅读 · 2018年1月19日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

相关论文

Realistic adversarial scenario generation via human-like pedestrian model for autonomous vehicle control parameter optimisation

Arxiv

0+阅读 · 2月4日

EgoFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving

Arxiv

0+阅读 · 2月2日

A Real-Time Privacy-Preserving Behavior Recognition System via Edge-Cloud Collaboration

Arxiv

0+阅读 · 1月30日

A Style-Based Profiling Framework for Quantifying the Synthetic-to-Real Gap in Autonomous Driving Datasets

Arxiv

0+阅读 · 1月26日

DMV-AVP: Distributed Multi-Vehicle Autonomous Valet Parking using Autoware

Arxiv

0+阅读 · 1月22日

Visual and Cognitive Demands of a Large Language Model-Powered In-vehicle Conversational Agent

Arxiv

0+阅读 · 1月21日

Vision-Language Models on the Edge for Real-Time Robotic Perception

Arxiv

0+阅读 · 1月21日

Zero-Shot Distracted Driver Detection via Vision Language Models with Double Decoupling

Arxiv

0+阅读 · 1月13日

Realistic adversarial scenario generation via human-like pedestrian model for autonomous vehicle control parameter optimisation

Arxiv

0+阅读 · 1月5日

Real-Time Lane Detection via Efficient Feature Alignment and Covariance Optimization for Low-Power Embedded Systems

Arxiv

0+阅读 · 1月5日

相关基金

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

面向车联网海量高速移动终端的高效信道信息获取机制

国家自然科学基金

0+阅读 · 2017年12月31日

基于时空模式的复杂行为识别方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

面向城市环境的车载机会网络关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

MRF模型的车载全景视觉位姿估计最优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于实时路况的乘用车经济环保出行路径规划方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于机器类型通信的车联网群组安全协议研究

国家自然科学基金

2+阅读 · 2015年12月31日

一种新型的基于行人检测与行走方向识别的辅助驾驶安全系统的设计与开发

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员