Model selection in penalized regression critically depends on an accurate assessment of model complexity, commonly quantified through the effective degrees of freedom. While the Lasso admits a simple and unbiased characterization, given by the size of the active set, this property does not extend to adaptive penalization methods, despite the widespread use of this approximation in practice. To solve this issue, in this paper we derive a novel unbiased estimator of the effective degrees of freedom for the Adaptive Lasso within Stein's unbiased risk estimation framework. Our analysis reveals additional terms induced by data-dependent penalization, reflecting the role of adaptive weights and regularization in determining model complexity. We further revisit the Group Lasso, providing an alternative derivation of its degrees of freedom, and extend these results to the Adaptive Group Lasso. Importantly, we characterize the behavior of the degrees of freedom along the regularization path beyond the orthonormal design setting commonly assumed in the literature, providing a new theoretical description of this behavior under general design matrices. By correcting the common misuse of active set size as a proxy for degrees of freedom, our results enable more reliable risk estimation and inference, offering a rigorous foundation for understanding model complexity in adaptive penalized regression.


翻译:在惩罚性回归中,模型选择的关键在于准确评估模型复杂度,通常通过有效自由度量化。虽然Lasso方法能够通过活跃集大小提供简单且无偏的刻画,但这一性质并不适用于自适应惩罚方法——尽管实践中广泛使用该近似。为解决此问题,本文在Stein无偏风险估计框架下,为自适应Lasso推导了有效自由度的新颖无偏估计量。我们的分析揭示了数据依赖惩罚导致的额外项,反映了自适应权重与正则化在确定模型复杂度中的作用。此外,我们重新考察了组Lasso,提供了其自由度的另一种推导,并将这些结果扩展到自适应组Lasso。重要的是,我们刻画了沿着正则化路径的自由度行为,突破了文献中通常假设的正交设计设定,在一般设计矩阵下提供了该行为的新理论描述。通过纠正将活跃集大小作为自由度代理的常见误用,我们的结果实现了更可靠的风险估计与推断,为理解自适应惩罚回归中的模型复杂度提供了严格基础。

0
下载
关闭预览

相关内容

Nature:大脑中的多时间尺度强化学习
专知会员服务
18+阅读 · 2025年6月8日
视觉自回归模型综述
专知会员服务
45+阅读 · 2024年11月15日
对比自监督学习
深度学习自然语言处理
35+阅读 · 2020年7月15日
从Seq2seq到Attention模型到Self Attention(二)
量化投资与机器学习
23+阅读 · 2018年10月9日
数据分析师应该知道的16种回归技术:弹性网络回归
数萃大数据
91+阅读 · 2018年8月16日
数据分析师应该知道的16种回归技术:Lasso回归
数萃大数据
16+阅读 · 2018年8月13日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月6日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
2+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
4+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
3+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
Nature:大脑中的多时间尺度强化学习
专知会员服务
18+阅读 · 2025年6月8日
视觉自回归模型综述
专知会员服务
45+阅读 · 2024年11月15日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员