Real-time Human Activity Recognition (HAR) has wide-ranging applications in areas such as context-aware environments, public safety, assistive technologies, and autonomous monitoring and surveillance systems. However, existing real-time HAR systems face significant challenges, including limited scalability and high computational costs arising from redundant features. To address these issues, the Inception-V3 model was customized with region-based and boundary-aware operations, using average pooling and max pooling, respectively, to enhance region homogeneity, suppress noise, and capture discriminative local features, while improving robustness through down-sampling. Furthermore, to effectively encode motion dynamics, an Attention-Augmented Long Short-Term Memory (AA-LSTM) network was employed to learn temporal dependencies across video frames. Features are extracted from video dataset and are then optimized through a novel proposed dynamic composite feature selection method called Adaptive Dynamic Fitness Sharing and Attention (ADFSA). This ADFSA mechanism is embedded within a genetic algorithm to select a compact, optimized subset of features by dynamically balancing multiple objectives, accuracy, redundancy reduction, feature uniqueness, and complexity minimization. As a result, the selected subset of diverse and discriminative features enables lightweight machine learning classifiers to achieve accurate and robust HAR in heterogeneous environments. Experimental results demonstrate up to 99.65\% accuracy using as few as seven selected features, with improved inference time on the challenging UCF-YouTube dataset, which includes factors such as occlusion, cluttered backgrounds, complex motion dynamics, and poor illumination conditions.


翻译:实时人类活动识别在情境感知环境、公共安全、辅助技术以及自主监控与安防系统等领域具有广泛应用。然而,现有实时人类活动识别系统面临显著挑战,包括由冗余特征导致的可扩展性受限和高计算成本。为解决这些问题,本研究对Inception-V3模型进行了定制化改进,分别采用基于区域和边界感知的操作,通过平均池化和最大池化来增强区域同质性、抑制噪声并捕获判别性局部特征,同时通过下采样提升鲁棒性。此外,为有效编码运动动态,采用注意力增强长短期记忆网络来学习视频帧间的时间依赖性。从视频数据集中提取特征后,通过一种新型动态复合特征选择方法——自适应动态适应度共享与注意力机制进行优化。该机制嵌入遗传算法中,通过动态平衡多项目标(准确率、冗余度降低、特征独特性及复杂度最小化)来选择紧凑优化的特征子集。最终,所选多样化判别性特征子集使得轻量级机器学习分类器能够在异构环境中实现准确鲁棒的人类活动识别。实验结果表明,在包含遮挡、杂乱背景、复杂运动动态和光照条件恶劣的挑战性UCF-YouTube数据集上,仅使用七个选定特征即可实现高达99.65%的准确率,并提升了推理速度。

0
下载
关闭预览

相关内容

【博士论文】融合上下文的鲁棒机器学习,311页pdf
专知会员服务
35+阅读 · 2024年2月6日
基于深度学习的自然语言处理鲁棒性研究
专知会员服务
30+阅读 · 2024年1月15日
《深度伪造检测模型的准确性和鲁棒性》2023最新论文
专知会员服务
41+阅读 · 2023年10月29日
深度学习模型鲁棒性研究综述
专知会员服务
97+阅读 · 2022年1月23日
专知会员服务
56+阅读 · 2021年3月5日
鲁棒模式识别研究进展
专知会员服务
41+阅读 · 2020年8月9日
读者来稿 | 有效遮挡检测的鲁棒人脸识别
计算机视觉战队
19+阅读 · 2019年3月28日
【紫冬声音】基于人体骨架的行为识别
中国自动化学会
17+阅读 · 2019年1月30日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
16+阅读 · 2018年7月26日
展望:模型驱动的深度学习
人工智能学家
12+阅读 · 2018年1月23日
从传统方法到深度学习,人脸关键点检测方法综述
机器之心
14+阅读 · 2017年12月17日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
VIP会员
相关VIP内容
【博士论文】融合上下文的鲁棒机器学习,311页pdf
专知会员服务
35+阅读 · 2024年2月6日
基于深度学习的自然语言处理鲁棒性研究
专知会员服务
30+阅读 · 2024年1月15日
《深度伪造检测模型的准确性和鲁棒性》2023最新论文
专知会员服务
41+阅读 · 2023年10月29日
深度学习模型鲁棒性研究综述
专知会员服务
97+阅读 · 2022年1月23日
专知会员服务
56+阅读 · 2021年3月5日
鲁棒模式识别研究进展
专知会员服务
41+阅读 · 2020年8月9日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员