Topological methods have the potential of exploring data clouds without making assumptions on their the structure. Here we propose a hierarchical topological clustering algorithm that can be implemented with any distance choice. The persistence of outliers and clusters of arbitrary shape is inferred from the resulting hierarchy. We demonstrate the potential of the algorithm on selected datasets in which outliers play relevant roles, consisting of images, medical and economic data. These methods can provide meaningful clusters in situations in which other techniques fail to do so.


翻译:拓扑方法具备探索数据云结构而无需对其形态做出先验假设的潜力。本文提出一种可适配任意距离度量的层次化拓扑聚类算法。通过分析生成的层次结构,可推断出异常点与任意形状簇的持续性特征。我们在包含图像、医疗及经济数据的若干选定数据集上验证了该算法的潜力,这些数据集中异常点均发挥着关键作用。实验表明,在传统聚类技术失效的场景下,本方法仍能生成具有实际意义的聚类结果。

0
下载
关闭预览

相关内容

用于多模态对齐的基础模型表征潜力:一项综述
专知会员服务
18+阅读 · 2025年10月8日
【CVPR2024】医学基础模型的低秩知识分解
专知会员服务
35+阅读 · 2024年4月29日
【AAAI2023】MHCCL:多变量时间序列的掩蔽层次聚类对比学习
【NeurIPS2022】分布式自适应元强化学习
专知会员服务
24+阅读 · 2022年10月8日
【WWW2021】张量时间序列网络
专知会员服务
44+阅读 · 2021年4月20日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
MNIST入门:贝叶斯方法
Python程序员
23+阅读 · 2017年7月3日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
用于多模态对齐的基础模型表征潜力:一项综述
专知会员服务
18+阅读 · 2025年10月8日
【CVPR2024】医学基础模型的低秩知识分解
专知会员服务
35+阅读 · 2024年4月29日
【AAAI2023】MHCCL:多变量时间序列的掩蔽层次聚类对比学习
【NeurIPS2022】分布式自适应元强化学习
专知会员服务
24+阅读 · 2022年10月8日
【WWW2021】张量时间序列网络
专知会员服务
44+阅读 · 2021年4月20日
相关资讯
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
MNIST入门:贝叶斯方法
Python程序员
23+阅读 · 2017年7月3日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员