We develop a class of data-adaptive shrinkage estimators for high-dimensional covariance estimation in which the shrinkage target is a Reynolds projection of the sample covariance under a finite symmetry group selected from a candidate library by held-out predictive performance. The class generalizes the convex shrinkage estimator of Ledoit and Wolf by replacing the scalar-identity target with a structured target derived from a symmetry group when one is available, and generalizes the group-symmetric maximum-likelihood estimator of Shah and Chandrasekaran by combining structural targeting with adaptive convex shrinkage and by selecting the group from data rather than treating it as prespecified. A two-tier procedure performs the group selection: a universal per-candidate evaluation based on held-out negative log-likelihood, optionally preceded by a domain-specific step that constructs the candidate library from structural priors. We establish a finite-sample regret bound for the held-out calibration of the convex combination weight, an oracle inequality for the data-driven group selection, and a quantitative sufficient-match condition under which the proposed estimator dominates Ledoit-Wolf shrinkage in Frobenius mean-squared error. The procedure is illustrated on six real-data problems spanning finance (S&P~500 daily returns), climate (NOAA OISST sea-surface temperature anomalies), genomics (TCGA-BRCA gene expression), radio signal processing (RadioML 2018.A), astronomical imaging (Galaxy10 DECaLS), and natural image patches (CIFAR-10 with a CIFAR-10.1 distribution-shift companion). An empirical comparison is also made against the Bayesian permutation-symmetry estimator of Chojecki and colleagues. Outside the few-shot regime, where structural priors carry the most information per observation, Ledoit-Wolf shrinkage remains the appropriate baseline.


翻译:针对高维协方差估计问题,本文提出一类数据自适应收缩估计方法。其核心思想是:将样本协方差矩阵在有限对称群(该群从候选库中通过留出预测性能进行选取)下的雷诺投影作为收缩目标。该方法通过引入结构化的对称群目标替代Ledoit-Wolf凸收缩估计中的标量单位矩阵目标,实现对该类方法的泛化;同时通过融合结构化目标与自适应凸收缩,并基于数据自主选取对称群(而非预先指定),将Shah与Chandrasekaran提出的群对称极大似然估计拓展至更广范畴。两阶段样本选取机制包括:基于留出负对数似然的通用候选评估阶段,以及可选的领域特定阶段(该阶段从结构先验中构建候选库)。本文建立了留出法校准凸组合权重的有限样本遗憾界、数据驱动群选取的Oracle不等式,以及定量刻画充分匹配条件的准则——在该条件下,所提估计器在Frobenius均方误差意义上优于Ledoit-Wolf收缩方法。通过六个实际数据案例验证方法有效性:金融领域(标普500指数日收益率)、气候科学(NOAA OISST海表温度异常)、基因组学(TCGA-BRCA基因表达)、无线电信号处理(RadioML 2018.A)、天文成像(Galaxy10 DECaLS)及自然图像块(含分布偏移参照集CIFAR-10.1的CIFAR-10数据集)。同时与Chojecki等学者提出的贝叶斯置换对称性估计器进行实证对比。结果表明:在结构先验信息量最充分的少样本场景外,Ledoit-Wolf收缩仍可作为有效的基准方法。

0
下载
关闭预览

相关内容

高分辨波达方位估计技术研究进展
专知会员服务
15+阅读 · 2025年2月3日
简述多种降维算法
算法与数学之美
11+阅读 · 2018年9月23日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
16+阅读 · 2018年7月26日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
高分辨波达方位估计技术研究进展
专知会员服务
15+阅读 · 2025年2月3日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员