Statistical data depth plays an important role in the analysis of multivariate data sets. The main outcome is a center-outward ordering of the observations that can be used both to highlight features of the underlying distribution of the data and as input to further statistical analysis. An important property of data depth is related to symmetric distributions as the point with the highest depth value, the center, coincides with the point of symmetry. However, there are applications in which it is more natural to consider symmetry with respect to a subspace of a certain dimension rather than to a point, i.e. a subspace of dimension zero. We provide a general framework to construct statistical data depths which attain maximum value in a subspace, providing a center-outward ordering from that subspace. We refer to these data depths as central subspace data depths. Moreover, if the distribution is symmetric with respect to a subspace, then the depth is maximized at that subspace. We introduce general notions of symmetry about a subspace for distributions, study the properties of central subspace data depths and provide asymptotic convergence for the corresponding sample versions. Additionally, we discuss connections with projection pursuit and dimension reduction. An application based on custom data fraud detection shows the importance of the proposed approach and strengthens its potential.


翻译:暂无翻译

0
下载
关闭预览

相关内容

WWW24 | 从数据中心化的角度校准图神经网络
专知会员服务
14+阅读 · 2024年9月14日
数据中心战
专知会员服务
49+阅读 · 2024年4月30日
2023中国数据要素生态研究报告
专知会员服务
49+阅读 · 2024年1月3日
以数据为中心的图机器学习
专知会员服务
37+阅读 · 2023年9月25日
中国数据中台行业研究报告
专知会员服务
64+阅读 · 2022年11月19日
专知会员服务
37+阅读 · 2021年2月26日
【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
105+阅读 · 2020年3月22日
【大规模数据系统,552页ppt】Large-scale Data Systems
专知会员服务
61+阅读 · 2019年12月21日
DataFun,就这?!
DataFunTalk
38+阅读 · 2020年9月27日
【数据中台】数据中台技术架构方案
产业智能官
15+阅读 · 2020年5月26日
【数据中台】什么是数据中台?
产业智能官
18+阅读 · 2019年7月30日
最佳实践:阿里巴巴数据中台
AliData
26+阅读 · 2019年7月26日
【资源推荐】公开数据集收集汇总
专知
19+阅读 · 2019年6月5日
【干货】电商数据中台如何构建?
AliData
11+阅读 · 2019年4月4日
【资源】史上最全数据集汇总
七月在线实验室
18+阅读 · 2018年4月24日
福利 | 最全面超大规模数据集下载链接汇总
AI研习社
26+阅读 · 2017年9月7日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月27日
Arxiv
17+阅读 · 2023年12月4日
Arxiv
95+阅读 · 2022年8月2日
Memory-Gated Recurrent Networks
Arxiv
12+阅读 · 2020年12月24日
VIP会员
相关VIP内容
WWW24 | 从数据中心化的角度校准图神经网络
专知会员服务
14+阅读 · 2024年9月14日
数据中心战
专知会员服务
49+阅读 · 2024年4月30日
2023中国数据要素生态研究报告
专知会员服务
49+阅读 · 2024年1月3日
以数据为中心的图机器学习
专知会员服务
37+阅读 · 2023年9月25日
中国数据中台行业研究报告
专知会员服务
64+阅读 · 2022年11月19日
专知会员服务
37+阅读 · 2021年2月26日
【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
105+阅读 · 2020年3月22日
【大规模数据系统,552页ppt】Large-scale Data Systems
专知会员服务
61+阅读 · 2019年12月21日
相关资讯
DataFun,就这?!
DataFunTalk
38+阅读 · 2020年9月27日
【数据中台】数据中台技术架构方案
产业智能官
15+阅读 · 2020年5月26日
【数据中台】什么是数据中台?
产业智能官
18+阅读 · 2019年7月30日
最佳实践:阿里巴巴数据中台
AliData
26+阅读 · 2019年7月26日
【资源推荐】公开数据集收集汇总
专知
19+阅读 · 2019年6月5日
【干货】电商数据中台如何构建?
AliData
11+阅读 · 2019年4月4日
【资源】史上最全数据集汇总
七月在线实验室
18+阅读 · 2018年4月24日
福利 | 最全面超大规模数据集下载链接汇总
AI研习社
26+阅读 · 2017年9月7日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员