Change point methods are used to divide a sequence of observations into segments with different behaviour. Often, the distributional form of the observations is unknown, but the changes of interest are likely to involve shifts in location, scale, or both. We consider the problem of detecting multiple change points in a sequence without specifying a parametric model for the data. We propose the WBS-Lepage procedure, a nonparametric method which combines wild binary segmentation with a rank-based Lepage statistic. The statistic is formed from Mann--Whitney and Mood components, which are respectively sensitive to changes in location and scale. Since it depends on the observations only through their ranks, its null distribution is distribution-free. This allows finite-sample thresholds to be calibrated by Monte Carlo simulation, providing direct control over the probability of falsely detecting change points when none exist. We compare WBS-Lepage with existing nonparametric change point methods, including penalised likelihood and binary-segmentation-based competitors. The proposed method performs competitively for location changes and is particularly effective for detecting changes in scale. We illustrate the procedure on a stylometric analysis of changes in an author's writing style and provide an implementation of our method in the accompanying R package npwbs.


翻译:变化点方法用于将观测序列划分为具有不同行为的分段。通常,观测的分布形式未知,但感兴趣的变化可能涉及位置、尺度或两者的偏移。我们考虑在不指定数据参数模型的情况下,检测序列中多个变化点的问题。我们提出WBS-Lepage程序,这是一种非参数方法,将野二分法与基于秩的Lepage统计量相结合。该统计量由Mann-Whitney和Mood分量构成,分别对位置和尺度的变化敏感。由于统计量仅通过秩依赖观测值,其零分布无需依赖分布假设。这使得可通过蒙特卡洛模拟校准有限样本阈值,从而直接控制在无变化点存在时错误检测变化点的概率。我们将WBS-Lepage与现有非参数变化点方法(包括惩罚似然法和基于二分法的竞争方法)进行比较。所提方法在位置变化场景中表现优秀,且对尺度变化的检测尤为有效。我们通过作者写作风格的文体计量分析示例展示了该程序,并在配套R包npwbs中提供了方法实现。

0
下载
关闭预览

相关内容

索邦大学121页博士论文《时间序列中的无监督异常检测》
专知会员服务
104+阅读 · 2022年7月25日
【AAAI2022】基于图神经网络的统一离群点异常检测方法
专知会员服务
28+阅读 · 2022年2月12日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
Seq2seq强化,Pointer Network简介
机器学习算法与Python学习
15+阅读 · 2018年12月8日
异常检测的阈值,你怎么选?给你整理好了...
机器学习算法与Python学习
10+阅读 · 2018年9月19日
时序异常检测算法概览
论智
29+阅读 · 2018年8月30日
深度学习时代的目标检测算法
炼数成金订阅号
40+阅读 · 2018年3月19日
侦测欺诈交易(异常点检测)
GBASE数据工程部数据团队
20+阅读 · 2017年5月10日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
0+阅读 · 3月23日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
1+阅读 · 今天15:00
21世纪的无人机战争
专知会员服务
2+阅读 · 今天14:05
《量子技术的军事任务技术适配与利用》
专知会员服务
2+阅读 · 今天13:51
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关资讯
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
Seq2seq强化,Pointer Network简介
机器学习算法与Python学习
15+阅读 · 2018年12月8日
异常检测的阈值,你怎么选?给你整理好了...
机器学习算法与Python学习
10+阅读 · 2018年9月19日
时序异常检测算法概览
论智
29+阅读 · 2018年8月30日
深度学习时代的目标检测算法
炼数成金订阅号
40+阅读 · 2018年3月19日
侦测欺诈交易(异常点检测)
GBASE数据工程部数据团队
20+阅读 · 2017年5月10日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员