Understanding historical datasets, such as the England and Wales infant mortality data, for local government districts can provide valuable insights into our changing society. Such analyses can prove challenging in practice, due to frequent changes in the boundaries of local government districts for which records are collected. One solution adopted in the literature to overcome such practical challenges is to pre-process data using areal interpolation to render the units consistent over the time period of focus. However, such methods are prone to errors. In this paper we introduce a novel changepoint method to detect instances where interpolation performs poorly. We demonstrate the utility of our method on original data, and also demonstrate how correcting interpolation errors can affect the clustering of the infant mortality curves.


翻译:理解地方行政区域的历史数据集(如英格兰与威尔士婴儿死亡率数据)能为社会变迁提供重要洞见。由于数据采集所依据的地方行政区划边界频繁变更,此类分析在实践中常面临挑战。现有研究为克服这一难题,常采用区域插值法对数据进行预处理,以使研究时段内的统计单元保持统一。然而,此类方法易产生误差。本文提出一种新颖的变点检测方法,用于识别插值效果不佳的实例。我们在原始数据上验证了该方法的有效性,并展示了修正插值误差如何影响婴儿死亡率曲线的聚类分析。

0
下载
关闭预览

相关内容

【经典书】统计学中的因果推断,156页pdf
专知会员服务
98+阅读 · 2022年6月14日
基于图注意力机制和Transformer的异常检测
专知会员服务
62+阅读 · 2022年5月16日
专知会员服务
237+阅读 · 2020年12月15日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
时空序列预测方法综述
专知
22+阅读 · 2020年10月19日
视线估计(Gaze Estimation)简介(一):概述
CVer
10+阅读 · 2020年3月18日
年龄估计技术综述
人工智能前沿讲习班
24+阅读 · 2019年2月19日
异常检测的阈值,你怎么选?给你整理好了...
机器学习算法与Python学习
10+阅读 · 2018年9月19日
[有意思的数学] 参数估计
机器学习和数学
15+阅读 · 2017年6月4日
侦测欺诈交易(异常点检测)
GBASE数据工程部数据团队
20+阅读 · 2017年5月10日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
VIP会员
相关VIP内容
【经典书】统计学中的因果推断,156页pdf
专知会员服务
98+阅读 · 2022年6月14日
基于图注意力机制和Transformer的异常检测
专知会员服务
62+阅读 · 2022年5月16日
专知会员服务
237+阅读 · 2020年12月15日
相关资讯
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
时空序列预测方法综述
专知
22+阅读 · 2020年10月19日
视线估计(Gaze Estimation)简介(一):概述
CVer
10+阅读 · 2020年3月18日
年龄估计技术综述
人工智能前沿讲习班
24+阅读 · 2019年2月19日
异常检测的阈值,你怎么选?给你整理好了...
机器学习算法与Python学习
10+阅读 · 2018年9月19日
[有意思的数学] 参数估计
机器学习和数学
15+阅读 · 2017年6月4日
侦测欺诈交易(异常点检测)
GBASE数据工程部数据团队
20+阅读 · 2017年5月10日
相关基金
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员