We consider a general model for high-dimensional empirical risk minimization whereby the data $\mathbf{x}_i$ are $d$-dimensional Gaussian vectors, the model is parametrized by $\mathbfΘ\in\mathbb{R}^{d\times k}$, and the loss depends on the data via the projection $\mathbfΘ^\mathsf{T}\mathbf{x}_i$. This setting covers as special cases classical statistics methods (e.g. multinomial regression and other generalized linear models), but also two-layer fully connected neural networks with $k$ hidden neurons. We use the Kac-Rice formula from Gaussian process theory to derive a bound on the expected number of local minima of this empirical risk, under the proportional asymptotics in which $n,d\to\infty$, with $n\asymp d$. Via Markov's inequality, this bound allows to determine the positions of these minimizers (with exponential deviation bounds) and hence derive sharp asymptotics on the estimation and prediction error. As a special case, we apply our characterization to convex losses. We show that our approach is tight and allows to prove previously conjectured results. In addition, we characterize the spectrum of the Hessian at the minimizer. A companion paper applies our general result to non-convex examples.


翻译:我们考虑一个高维经验风险最小化的一般模型,其中数据$\mathbf{x}_i$为$d$维高斯向量,模型由参数$\mathbfΘ\in\mathbb{R}^{d\times k}$参数化,且损失函数通过投影$\mathbfΘ^\mathsf{T}\mathbf{x}_i$依赖于数据。该框架涵盖了经典统计方法(例如多项回归及其他广义线性模型)以及具有$k$个隐藏神经元的两层全连接神经网络作为特例。我们利用高斯过程理论中的Kac-Rice公式推导了该经验风险局部极小值期望数量的上界,该结果基于比例渐近假设:$n,d\to\infty$且$n\asymp d$。通过马尔可夫不等式,该上界可用于确定这些极小值点的位置(具有指数型偏差界),从而推导出估计误差与预测误差的精确渐近性质。作为特例,我们将该特征刻画应用于凸损失函数。研究表明,我们的方法是紧致的,且能够证明先前猜想的结果。此外,我们还刻画了极小值点处Hessian矩阵的谱特性。在另一篇配套论文中,我们将此一般结果应用于非凸函数示例。

0
下载
关闭预览

相关内容

【经典书】高维概率数据科学应用导论,301页pdf
专知会员服务
92+阅读 · 2021年6月17日
从信息论的角度来理解损失函数
深度学习每日摘要
17+阅读 · 2019年4月7日
简述多种降维算法
算法与数学之美
11+阅读 · 2018年9月23日
详解常见的损失函数
七月在线实验室
20+阅读 · 2018年7月12日
概率图模型体系:HMM、MEMM、CRF
机器学习研究会
30+阅读 · 2018年2月10日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
VIP会员
相关VIP内容
【经典书】高维概率数据科学应用导论,301页pdf
专知会员服务
92+阅读 · 2021年6月17日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员