Feature engineering continues to play a critical role in image classification, particularly when interpretability and computational efficiency are prioritized over deep learning models with millions of parameters. In this study, we revisit classical machine learning based image classification through a novel approach centered on Permutation Entropy (PE), a robust and computationally lightweight measure traditionally used in time series analysis but rarely applied to image data. We extend PE to two-dimensional images and propose a multiscale, multi-orientation entropy-based feature extraction approach that characterizes spatial order and complexity along rows, columns, diagonals, anti-diagonals, and local patches of the image. To enhance the discriminatory power of the entropy features, we integrate two classic image descriptors: the Histogram of Oriented Gradients (HOG) to capture shape and edge structure, and Local Binary Patterns (LBP) to encode micro-texture of an image. The resulting hand-crafted feature set, comprising of 780 dimensions, is used to train Support Vector Machine (SVM) classifiers optimized through grid search. The proposed approach is evaluated on multiple benchmark datasets, including Fashion-MNIST, KMNIST, EMNIST, and CIFAR-10, where it delivers competitive classification performance without relying on deep architectures. Our results demonstrate that the fusion of PE with HOG and LBP provides a compact, interpretable, and effective alternative to computationally expensive and limited interpretable deep learning models. This shows a potential of entropy-based descriptors in image classification and contributes a lightweight and generalizable solution to interpretable machine learning in image classification and computer vision.


翻译:特征工程在图像分类中持续发挥着关键作用,尤其是在可解释性与计算效率优先于具有数百万参数的深度学习模型时。本研究通过一种以排列熵(PE)为核心的新颖方法,重新审视基于经典机器学习的图像分类。PE是一种鲁棒且计算轻量的度量,传统上用于时间序列分析,但极少应用于图像数据。我们将PE扩展至二维图像,并提出一种多尺度、多方向的基于熵的特征提取方法,该方法沿着图像的行、列、对角线、反对角线以及局部图像块来刻画空间有序性与复杂性。为了增强熵特征的判别能力,我们整合了两种经典的图像描述符:用于捕捉形状与边缘结构的定向梯度直方图(HOG),以及用于编码图像微观纹理的局部二值模式(LBP)。由此产生的手工特征集包含780个维度,用于训练通过网格搜索优化的支持向量机(SVM)分类器。所提出的方法在多个基准数据集上进行了评估,包括Fashion-MNIST、KMNIST、EMNIST和CIFAR-10,结果表明,在不依赖深度架构的情况下,该方法实现了具有竞争力的分类性能。我们的结果表明,PE与HOG和LBP的融合为计算成本高昂且可解释性有限的深度学习模型提供了一种紧凑、可解释且有效的替代方案。这展示了基于熵的描述符在图像分类中的潜力,并为图像分类与计算机视觉领域中的可解释机器学习贡献了一种轻量且可泛化的解决方案。

0
下载
关闭预览

相关内容

基于主动学习的图像分类技术:现状与未来
专知会员服务
37+阅读 · 2024年1月8日
推荐算法中的特征工程
专知会员服务
40+阅读 · 2022年9月9日
图像分类的深度卷积神经网络模型综述
专知会员服务
57+阅读 · 2021年10月29日
【干货书】机器学习特征工程,217页pdf
专知会员服务
128+阅读 · 2021年2月6日
【经典书】精通机器学习特征工程,中文版,178页pdf
专知会员服务
360+阅读 · 2020年2月15日
新书《面向机器学习和数据分析的特征工程》,419页pdf
专知会员服务
144+阅读 · 2019年10月10日
手把手教你用Python实现自动特征工程
量子位
12+阅读 · 2018年9月3日
【干货合集】一文读懂特征工程
七月在线实验室
13+阅读 · 2018年8月2日
一文看懂常用特征工程方法
AI研习社
17+阅读 · 2018年5月2日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关资讯
手把手教你用Python实现自动特征工程
量子位
12+阅读 · 2018年9月3日
【干货合集】一文读懂特征工程
七月在线实验室
13+阅读 · 2018年8月2日
一文看懂常用特征工程方法
AI研习社
17+阅读 · 2018年5月2日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员