Standard kernel two-sample tests, such as those based on the Maximum Mean Discrepancy (MMD), aggregate squared differences across all directions in a Reproducing Kernel Hilbert Space (RKHS). However, in finite samples, trailing directional components are noisy, which degrades test power. We propose a novel kernel-based test that resolves this by truncating the spectral decomposition of the MMD, retaining only the well-estimated leading eigen-directions. By aggregating these robust components, our method achieves superior power and robustness, particularly in high-dimensional and unbalanced settings. Furthermore, we introduce a computationally efficient parametric bootstrap procedure for approximating critical values, which is theoretically justified and significantly faster than permutation-based alternatives. Extensive simulations and empirical studies demonstrate that our method maintains strict Type I error control while delivering higher power than existing MMD-based tests.


翻译:标准核双样本检验(例如基于最大均值差异的方法)通过聚合再生核希尔伯特空间中所有方向上的平方差异进行检验。然而在有限样本条件下,尾部方向分量存在噪声,这削弱了检验效能。我们提出一种新型核检验方法,通过对MMD的谱分解进行截断,仅保留估计稳健的前导特征方向来消除该问题。通过聚合这些稳健分量,我们的方法在维度失衡与非均衡设定下均能实现更优的检验效能与鲁棒性。此外,我们引入计算高效的参数化自助法程序来近似临界值,该程序具有理论保障且显著优于基于置换的替代方案。大量模拟与实证研究表明,该方法在保持严格的第一类错误控制的同时,相较于现有MMD检验方法具有更高的检验效能。

0
下载
关闭预览

相关内容

【AAAI2025】核感知图提示学习用于少样本异常检测
专知会员服务
18+阅读 · 2024年12月24日
基于解耦的小样本目标检测方法研究
专知会员服务
19+阅读 · 2024年9月19日
【AAAI2022】基于图神经网络的统一离群点异常检测方法
专知会员服务
28+阅读 · 2022年2月12日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
目标检测小tricks之样本不均衡处理
PaperWeekly
49+阅读 · 2019年4月5日
【紫冬新作】人脸识别新突破:真实场景下的大规模双样本学习方法
中国科学院自动化研究所
11+阅读 · 2019年3月7日
数据分析师应该知道的16种回归方法:负二项回归
数萃大数据
74+阅读 · 2018年9月16日
深度学习时代的目标检测算法
炼数成金订阅号
40+阅读 · 2018年3月19日
综述:深度学习时代的目标检测算法
极市平台
27+阅读 · 2018年3月17日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
《通过小型无人机系统将情报能力“作战化”》
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
《离线语言支持系统:面向空战战术决策》
专知会员服务
10+阅读 · 6月15日
相关VIP内容
【AAAI2025】核感知图提示学习用于少样本异常检测
专知会员服务
18+阅读 · 2024年12月24日
基于解耦的小样本目标检测方法研究
专知会员服务
19+阅读 · 2024年9月19日
【AAAI2022】基于图神经网络的统一离群点异常检测方法
专知会员服务
28+阅读 · 2022年2月12日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员