Modern multi-class image classification relies on high-dimensional CNN feature vectors, which are computationally expensive and obscure the underlying data geometry. Conventional graph-based classifiers degrade on natural multi-class images because typical graphs fail to preserve separability on feature manifolds with complex topology. We address this with a physics-inspired pipeline frozen MobileNetV2 embeddings are treated as Ising spins on a sparse Multi-Edge Type QC-LDPC graph forming a Random Bond Ising Model. The system is tuned to its Nishimori temperature identified where the smallest Bethe-Hessian eigenvalue vanishes. Our method rests on two innovations: we prove a spectral-topological correspondence linking graph trapping sets to invariants via the Ihara-Bass zeta function removing these structures boosts top-1 accuracy over four-fold in multi-class settings; we develop a quadratic-Newton estimator for the Nishimori temperature converging in around 9 Arnoldi iterations for a 6-times speedup enabling spectral embedding on scales like ImageNet-100. The resulting graphs compress 1280-dimensional MobileNetV2 features to 32 dimensions for ImageNet10 and 64 for ImageNet-100 We achieve 98.7% top-1 accuracy on ImageNet-10 and 84.92% on ImageNet-100 with a three-graph soft ensemble Versus MobileNetV2 our hard ensemble increases top-1 by 0.1% while cutting FLOPs by 2.67-times compared to ResNet50 the soft ensemble drops top1 by only 1.09% yet reduces FLOPs by 29-times. Novelty lies in (a) rigorously linking trapping sets to topological defects, (b) an efficient Nishimori temperature estimator and (c) demonstrating that topology-guided LDPC embedding produces highly compressed accurate classifiers for resource-constrained deployment


翻译:现代多类图像分类依赖于高维CNN特征向量,这种方法计算成本高昂且模糊了底层数据几何结构。传统的基于图的分类器在自然多类图像上性能下降,因为典型图结构难以在具有复杂拓扑的特征流形上保持可分性。我们通过一种受物理学启发的流程解决此问题:冻结的MobileNetV2嵌入被视为稀疏多边类型QC-LDPC图上的伊辛自旋,构成随机键伊辛模型。该系统被调节至其西岛温度,该温度通过最小贝特-黑塞特征值消失点确定。我们的方法基于两项创新:我们证明了谱-拓扑对应关系,通过伊原-巴斯ζ函数将图陷阱集与不变量联系起来,移除这些结构使多类场景下的top-1准确率提升超过四倍;我们开发了西岛温度的二次-牛顿估计器,约9次阿诺尔迪迭代即可收敛,实现6倍加速,从而支持ImageNet-100等规模的谱嵌入。所得图将1280维MobileNetV2特征压缩至32维(ImageNet-10)和64维(ImageNet-100)。通过三图软集成,我们在ImageNet-10上达到98.7%的top-1准确率,在ImageNet-100上达到84.92%。相较于MobileNetV2,我们的硬集成将top-1准确率提升0.1%,同时将FLOPs降低2.67倍;与ResNet50相比,软集成仅使top-1准确率下降1.09%,却将FLOPs减少29倍。创新性体现在:(a)严格建立陷阱集与拓扑缺陷的关联,(b)高效的西岛温度估计器,(c)证明拓扑引导的LDPC嵌入能为资源受限部署生成高度压缩的精确分类器。

0
下载
关闭预览

相关内容

基于主动学习的图像分类技术:现状与未来
专知会员服务
37+阅读 · 2024年1月8日
Transformer 驱动的图像分类研究进展综述
专知会员服务
55+阅读 · 2023年2月24日
图像分类的深度卷积神经网络模型综述
专知会员服务
57+阅读 · 2021年10月29日
细粒度图像分类的深度学习方法
专知会员服务
43+阅读 · 2021年10月18日
基于小样本学习的图像分类技术综述
专知会员服务
152+阅读 · 2020年5月6日
图分类相关资源大列表
专知
11+阅读 · 2019年7月18日
图卷积神经网络(GCN)文本分类详述
专知
280+阅读 · 2019年4月5日
图分类:结合胶囊网络Capsule和图卷积GCN(附代码)
中国人工智能学会
36+阅读 · 2019年2月26日
专栏 | 手把手教你用DGL框架进行批量图分类
机器之心
14+阅读 · 2019年1月29日
【干货】李沐等人:CNN图像分类Trick合集(附详细代码)
GAN生成式对抗网络
58+阅读 · 2018年12月11日
关于CNN图像分类的一份综合设计指南
云栖社区
11+阅读 · 2018年5月15日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
相关VIP内容
基于主动学习的图像分类技术:现状与未来
专知会员服务
37+阅读 · 2024年1月8日
Transformer 驱动的图像分类研究进展综述
专知会员服务
55+阅读 · 2023年2月24日
图像分类的深度卷积神经网络模型综述
专知会员服务
57+阅读 · 2021年10月29日
细粒度图像分类的深度学习方法
专知会员服务
43+阅读 · 2021年10月18日
基于小样本学习的图像分类技术综述
专知会员服务
152+阅读 · 2020年5月6日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员