This paper presents Two-Stage LKPLO, a novel multi-stage outlier detection framework that overcomes the coexisting limitations of conventional projection-based methods: their reliance on a fixed statistical metric and their assumption of a single data structure. Our framework uniquely synthesizes three key concepts: (1) a generalized loss-based outlyingness measure (PLO) that replaces the fixed metric with flexible, adaptive loss functions like our proposed SVM-like loss; (2) a global kernel PCA stage to linearize non-linear data structures; and (3) a subsequent local clustering stage to handle multi-modal distributions. Comprehensive 5-fold cross-validation experiments on 10 benchmark datasets, with automated hyperparameter optimization, demonstrate that Two-Stage LKPLO achieves state-of-the-art performance. It significantly outperforms strong baselines on datasets with challenging structures where existing methods fail, most notably on multi-cluster data (Optdigits) and complex, high-dimensional data (Arrhythmia). Furthermore, an ablation study empirically confirms that the synergistic combination of both the kernelization and localization stages is indispensable for its superior performance. This work contributes a powerful new tool for a significant class of outlier detection problems and underscores the importance of hybrid, multi-stage architectures.


翻译:本文提出两阶段局部核投影离群度(Two-Stage LKPLO),这是一种新颖的多阶段离群检测框架,克服了传统基于投影方法的共存局限性:即依赖固定统计度量以及假设单一数据结构的缺陷。我们的框架独特地综合了三个核心概念:(1) 一种广义的基于损失的离群度量(PLO),用灵活的自适应损失函数(如我们提出的类SVM损失)替代固定度量;(2) 一个全局核主成分分析阶段,用于线性化非线性数据结构;(3) 一个后续的局部聚类阶段,用于处理多模态分布。在10个基准数据集上进行的全面五折交叉验证实验,结合自动超参数优化,表明两阶段LKPLO实现了最先进的性能。它显著优于在现有方法失效的具有挑战性结构的数据集上的强基线,尤其是在多簇数据(Optdigits)和复杂高维数据(Arrhythmia)上。此外,消融研究实证确认,核化与局部化阶段的协同组合对其卓越性能是必不可少的。这项工作为解决一类重要的离群检测问题提供了强有力的新工具,并强调了混合多阶段架构的重要性。

0
下载
关闭预览

相关内容

面向无人机视角的多源信息融合目标检测
专知会员服务
19+阅读 · 2025年2月2日
【AAAI2022】基于图神经网络的统一离群点异常检测方法
专知会员服务
28+阅读 · 2022年2月12日
目标检测小tricks之样本不均衡处理
PaperWeekly
49+阅读 · 2019年4月5日
深度学习时代的目标检测算法
炼数成金订阅号
40+阅读 · 2018年3月19日
综述:深度学习时代的目标检测算法
极市平台
27+阅读 · 2018年3月17日
基于区域的目标检测——细粒度
计算机视觉战队
14+阅读 · 2018年2月1日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
侦测欺诈交易(异常点检测)
GBASE数据工程部数据团队
20+阅读 · 2017年5月10日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
最新内容
《通过小型无人机系统将情报能力“作战化”》
专知会员服务
4+阅读 · 今天7:28
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
《离线语言支持系统:面向空战战术决策》
专知会员服务
8+阅读 · 6月15日
相关VIP内容
面向无人机视角的多源信息融合目标检测
专知会员服务
19+阅读 · 2025年2月2日
【AAAI2022】基于图神经网络的统一离群点异常检测方法
专知会员服务
28+阅读 · 2022年2月12日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员