An Empirical Analysis of Optimization Dynamics and Sparsity Boundaries in Large-Scale Pedestrian Attribute Recognition - 专知论文

会员服务 ·

0

识别 · 属性 · 行人 · 属性识别 · 稀疏 ·

An Empirical Analysis of Optimization Dynamics and Sparsity Boundaries in Large-Scale Pedestrian Attribute Recognition

翻译：大规模行人属性识别中优化动态与稀疏边界的实证分析

Pedestrian Attribute Recognition (PAR) is critical for video surveillance, enabling forensic search and re-identification systems. Extreme class imbalance remains a fundamental obstacle when merging PETA and PA-100K into a 109,000-image composite corpus, where minority attributes have positive sample fractions below 1%. This causes standard BCE optimization to suppress rare traits, a phenomenon we term the majority negative class cheating trap. We present a systematic ablation of Multi-Label Focal Loss hyperparameters (alpha and gamma) on a ResNet-18 backbone. A calibrated configuration (alpha=0.50, gamma=2.0) achieves a Macro F1-score of 62.32%, matching BCE baseline while preserving superior hard-example mining and convergence dynamics. Our approach uses pure loss-function engineering with zero computational overhead for edge deployment. We identify the Sparsity Wall, a hard boundary where positive sample fractions below 0.1% make global loss reweighting ineffective, requiring instance-level intervention.

翻译：行人属性识别（PAR）在视频监控中至关重要，可支持法医搜索和重识别系统。当合并PETA和PA-100K形成包含109,000张图像的复合语料库时，极端类别不平衡仍是一个根本性障碍——其中少数属性的正样本比例低于1%。这导致标准二元交叉熵（BCE）优化会抑制罕见特征，我们将此现象称为"多数负类欺骗陷阱"。我们以ResNet-18为骨干网络，系统性地消融了多标签焦点损失的超参数（alpha和gamma）。经校准的配置（alpha=0.50, gamma=2.0）实现了62.32%的宏F1分数，与BCE基线持平，同时保留了更优的难例挖掘能力和收敛动态。本方法仅依赖纯损失函数工程，在边缘部署中实现零计算开销。我们识别出"稀疏墙"这一硬边界——当正样本比例低于0.1%时，全局损失重加权失效，需要引入实例级别的干预机制。

0

相关内容

无监督行人重识别研究综述

无监督行人重识别研究综述

专知会员服务

18+阅读 · 2025年8月3日

「面向复杂场景的行人重识别综述」最新2022研究进展综述

「面向复杂场景的行人重识别综述」最新2022研究进展综述

专知会员服务

38+阅读 · 2022年11月3日

【经典课程】《基于深度学习和行人重识别》，附课件与视频

【经典课程】《基于深度学习和行人重识别》，附课件与视频

专知会员服务

24+阅读 · 2022年9月24日

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

专知会员服务

12+阅读 · 2022年3月22日

面向行人重识别的局部特征研究进展、挑战与展望

面向行人重识别的局部特征研究进展、挑战与展望

专知会员服务

27+阅读 · 2021年10月13日

多源数据行人重识别研究综述

多源数据行人重识别研究综述

专知会员服务

42+阅读 · 2020年11月2日

深度学习行人再识别研究综述

专知会员服务

38+阅读 · 2020年8月19日

最新《深度学习行人重识别》综述论文，24页pdf

最新《深度学习行人重识别》综述论文，24页pdf

专知会员服务

81+阅读 · 2020年5月5日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

基于深度学习的行人重识别研究进展，自动化学报

基于深度学习的行人重识别研究进展，自动化学报

专知会员服务

39+阅读 · 2019年12月5日

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

微软研究院AI头条

10+阅读 · 2019年7月5日

基于人体骨架的行为识别【附PPT与视频资料】

基于人体骨架的行为识别【附PPT与视频资料】

人工智能前沿讲习班

31+阅读 · 2019年1月15日

干货！一文读懂行人检测算法

干货！一文读懂行人检测算法

全球人工智能

11+阅读 · 2018年5月31日

【论文推荐】最新五篇视频分类相关论文—细粒度行人识别、群组归一化、MLtuner、时序特征

【论文推荐】最新五篇视频分类相关论文—细粒度行人识别、群组归一化、MLtuner、时序特征

专知

22+阅读 · 2018年4月21日

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

专知

12+阅读 · 2018年3月24日

独家 | 基于深度学习的行人重识别研究综述

独家 | 基于深度学习的行人重识别研究综述

AI科技评论

11+阅读 · 2017年12月20日

行人再识别中的迁移学习

行人再识别中的迁移学习

计算机视觉战队

11+阅读 · 2017年12月20日

干货｜基于双流递归神经网络的人体骨架行为识别！

干货｜基于双流递归神经网络的人体骨架行为识别！

全球人工智能

13+阅读 · 2017年12月15日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

极市平台

14+阅读 · 2017年7月24日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

行人重识别目标中心编码外观模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于非线性流形学习的极化SAR特征提取与匹配技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于排队模型的动态车辆路径问题实时优化策略及算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

A Gradient Perspective on RLVR Stability and Winner Advantage Policy Optimization

Arxiv

0+阅读 · 6月15日

Imbalanced Classification under Capacity Constraints

Arxiv

0+阅读 · 6月14日

Analyzing and Improving Fine-grained Preference Optimization in Medical LVLMs

Arxiv

0+阅读 · 6月10日

Learning Instance-Adaptive Low-Rank Orthogonal Subspaces for Clothes-Changing Person Re-Identification

Arxiv

0+阅读 · 6月10日

Context-Conditioned Generative Models Enable Subnational Refinement of Sparse Humanitarian Surveys

Arxiv

0+阅读 · 6月4日

Calibrating Urban Traffic Simulation from Sparse Road Observations via Genetic Optimization

Arxiv

0+阅读 · 6月2日

Higher-order Network Analysis of Human Mobility Data

Arxiv

0+阅读 · 5月30日

A Large-Scale Study on the Accuracy vs Cost Trade-offs of Training and Evaluation Settings in Fine-Grained Image Recognition

Arxiv

0+阅读 · 5月18日

View-Aware Semantic Alignment for Aerial-Ground Person Re-Identification

Arxiv

0+阅读 · 5月18日

DPM++: Dynamic Masked Metric Learning for Occluded Person Re-identification

Arxiv

0+阅读 · 5月7日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

0+阅读 · 12分钟前

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 44分钟前

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 46分钟前

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

11+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

无监督行人重识别研究综述

无监督行人重识别研究综述

专知会员服务

18+阅读 · 2025年8月3日

「面向复杂场景的行人重识别综述」最新2022研究进展综述

「面向复杂场景的行人重识别综述」最新2022研究进展综述

专知会员服务

38+阅读 · 2022年11月3日

【经典课程】《基于深度学习和行人重识别》，附课件与视频

【经典课程】《基于深度学习和行人重识别》，附课件与视频

专知会员服务

24+阅读 · 2022年9月24日

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

专知会员服务

12+阅读 · 2022年3月22日

面向行人重识别的局部特征研究进展、挑战与展望

面向行人重识别的局部特征研究进展、挑战与展望

专知会员服务

27+阅读 · 2021年10月13日

多源数据行人重识别研究综述

多源数据行人重识别研究综述

专知会员服务

42+阅读 · 2020年11月2日

深度学习行人再识别研究综述

专知会员服务

38+阅读 · 2020年8月19日

最新《深度学习行人重识别》综述论文，24页pdf

最新《深度学习行人重识别》综述论文，24页pdf

专知会员服务

81+阅读 · 2020年5月5日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

基于深度学习的行人重识别研究进展，自动化学报

基于深度学习的行人重识别研究进展，自动化学报

专知会员服务

39+阅读 · 2019年12月5日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

相关资讯

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

微软研究院AI头条

10+阅读 · 2019年7月5日

基于人体骨架的行为识别【附PPT与视频资料】

基于人体骨架的行为识别【附PPT与视频资料】

人工智能前沿讲习班

31+阅读 · 2019年1月15日

干货！一文读懂行人检测算法

干货！一文读懂行人检测算法

全球人工智能

11+阅读 · 2018年5月31日

【论文推荐】最新五篇视频分类相关论文—细粒度行人识别、群组归一化、MLtuner、时序特征

【论文推荐】最新五篇视频分类相关论文—细粒度行人识别、群组归一化、MLtuner、时序特征

专知

22+阅读 · 2018年4月21日

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

专知

12+阅读 · 2018年3月24日

独家 | 基于深度学习的行人重识别研究综述

独家 | 基于深度学习的行人重识别研究综述

AI科技评论

11+阅读 · 2017年12月20日

行人再识别中的迁移学习

行人再识别中的迁移学习

计算机视觉战队

11+阅读 · 2017年12月20日

干货｜基于双流递归神经网络的人体骨架行为识别！

干货｜基于双流递归神经网络的人体骨架行为识别！

全球人工智能

13+阅读 · 2017年12月15日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

极市平台

14+阅读 · 2017年7月24日

相关论文

A Gradient Perspective on RLVR Stability and Winner Advantage Policy Optimization

Arxiv

0+阅读 · 6月15日

Imbalanced Classification under Capacity Constraints

Arxiv

0+阅读 · 6月14日

Analyzing and Improving Fine-grained Preference Optimization in Medical LVLMs

Arxiv

0+阅读 · 6月10日

Learning Instance-Adaptive Low-Rank Orthogonal Subspaces for Clothes-Changing Person Re-Identification

Arxiv

0+阅读 · 6月10日

Context-Conditioned Generative Models Enable Subnational Refinement of Sparse Humanitarian Surveys

Arxiv

0+阅读 · 6月4日

Calibrating Urban Traffic Simulation from Sparse Road Observations via Genetic Optimization

Arxiv

0+阅读 · 6月2日

Higher-order Network Analysis of Human Mobility Data

Arxiv

0+阅读 · 5月30日

A Large-Scale Study on the Accuracy vs Cost Trade-offs of Training and Evaluation Settings in Fine-Grained Image Recognition

Arxiv

0+阅读 · 5月18日

View-Aware Semantic Alignment for Aerial-Ground Person Re-Identification

Arxiv

0+阅读 · 5月18日

DPM++: Dynamic Masked Metric Learning for Occluded Person Re-identification

Arxiv

0+阅读 · 5月7日

相关基金

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

行人重识别目标中心编码外观模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于非线性流形学习的极化SAR特征提取与匹配技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于排队模型的动态车辆路径问题实时优化策略及算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员