Testing for normality is a widely used procedure in statistics and data analysis, often applied prior to employing methods that rely on the assumption of normally distributed data. While several existing tests target distributional characteristics such as higher-order moments, others focus on functional aspects such as the distribution function. In this article, we propose an alternative idea by exploiting the self-similarity property of the normal distribution and introduce the Self-Similarity Test for Normality (SSTN). This procedure leverages the structural property that the distribution of a suitably centered and scaled sum of independent and identically distributed random variables with finite variance coincides with the original distribution if and only if that distribution is normal. The SSTN evaluates normality by applying a self-similarity transformation to the standardized empirical characteristic function and examining how the transformed functions change across successive applications. For the normal distribution, repeated applications preserve the functional form of the characteristic function, whereas deviations from normality manifest in systematic changes between consecutive transforms. These changes are aggregated into a test statistic, whose null distribution is obtained by Monte Carlo calibration, using a sample-size-specific calibration for small samples and an approximation of the asymptotic null distribution for larger ones. A comprehensive simulation study shows that the SSTN performs at least competitively and frequently superior to several well-established tests for normality.


翻译:正态性检验是统计学和数据分析中广泛使用的程序,通常在使用依赖正态分布数据假设的方法之前进行。虽然一些现有检验针对分布特征(如高阶矩),其他检验则关注分布函数等函数方面。本文提出了一种替代思路,利用正态分布的自相似性属性,并引入了自相似性正态性检验(SSTN)。该方法利用了如下结构性质:若且仅当分布为正态时,适当中心化和缩放后的独立同分布(具有有限方差)随机变量之和的分布与其原始分布一致。SSTN通过将自相似性变换应用于标准化经验特征函数,并考察变换函数在连续应用中的变化来评估正态性。对于正态分布,重复应用能保持特征函数的函数形式;而偏离正态性则表现为连续变换之间的系统性变化。这些变化被汇总为一个检验统计量,其零分布通过蒙特卡洛校准获得——小样本时采用样本量特定的校准,大样本时则使用渐近零分布的近似值。全面的模拟研究表明,SSTN在与多种经典正态性检验的比较中至少具有竞争力,且通常表现更优。

0
下载
关闭预览

相关内容

专知会员服务
53+阅读 · 2021年8月13日
专知会员服务
17+阅读 · 2021年5月13日
专知会员服务
62+阅读 · 2021年3月25日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
对比自监督学习
深度学习自然语言处理
35+阅读 · 2020年7月15日
【学界】虚拟对抗训练:一种新颖的半监督学习正则化方法
GAN生成式对抗网络
10+阅读 · 2019年6月9日
干货 | 视频显著性目标检测(文末附有完整源码)
计算机视觉战队
14+阅读 · 2019年4月29日
各种相似性度量及Python实现
机器学习算法与Python学习
11+阅读 · 2017年7月6日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
4+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关资讯
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
对比自监督学习
深度学习自然语言处理
35+阅读 · 2020年7月15日
【学界】虚拟对抗训练:一种新颖的半监督学习正则化方法
GAN生成式对抗网络
10+阅读 · 2019年6月9日
干货 | 视频显著性目标检测(文末附有完整源码)
计算机视觉战队
14+阅读 · 2019年4月29日
各种相似性度量及Python实现
机器学习算法与Python学习
11+阅读 · 2017年7月6日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员