Ensemble learning is a popular technique to improve the accuracy of machine learning models. It traditionally hinges on the rationale that aggregating multiple weak models can lead to better models with lower variance and hence higher stability, especially for discontinuous base learners. In this paper, we provide a new perspective on ensembling. By selecting the most frequently generated model from the base learner when repeatedly applied to subsamples, we can attain exponentially decaying tails for the excess risk, even if the base learner suffers from slow (i.e., polynomial) decay rates. This tail enhancement power of ensembling applies to base learners that have reasonable predictive power to begin with and is stronger than variance reduction in the sense of exhibiting rate improvement. We demonstrate how our ensemble methods can substantially improve out-of-sample performances in a range of numerical examples involving heavy-tailed data or intrinsically slow rates.


翻译:集成学习是提升机器学习模型准确性的常用技术。传统上,其核心原理在于:聚合多个弱模型可获得方差更低、稳定性更高的更优模型,尤其适用于不连续的基础学习器。本文提出一种关于集成的新视角:通过对基础学习器重复应用于子样本时最常生成的模型进行选择,即使基础学习器存在衰减速率缓慢(即多项式衰减)的问题,我们仍能实现超额风险的指数级衰减尾部。这种集成方法的尾部增强能力适用于本身具有合理预测能力的基础学习器,且在体现速率改进的意义上强于方差缩减。我们通过一系列涉及重尾数据或固有慢速率的数值算例,展示了所提集成方法如何显著提升样本外性能。

0
下载
关闭预览

相关内容

【CMU博士论文】深度学习中泛化的量化、理解与改进
专知会员服务
21+阅读 · 2025年10月11日
深度学习中泛化的量化、理解与改进
专知会员服务
17+阅读 · 2025年9月13日
扩散模型概述:应用、引导生成、统计率和优化
专知会员服务
47+阅读 · 2024年4月14日
集成学习研究现状及展望
专知会员服务
58+阅读 · 2023年7月20日
【2023新书】机器学习集成方法,354页pdf
专知会员服务
184+阅读 · 2023年4月11日
专知会员服务
26+阅读 · 2021年5月23日
【2023新书】机器学习集成方法,354页pdf
专知
40+阅读 · 2023年4月11日
常用的模型集成方法介绍:bagging、boosting 、stacking
视频生成的前沿论文,看我们推荐的7篇就够了
人工智能前沿讲习班
34+阅读 · 2018年12月30日
从浅层模型到深度模型:概览机器学习优化算法
机器之心
27+阅读 · 2017年7月9日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
0+阅读 · 2025年12月30日
VIP会员
相关VIP内容
【CMU博士论文】深度学习中泛化的量化、理解与改进
专知会员服务
21+阅读 · 2025年10月11日
深度学习中泛化的量化、理解与改进
专知会员服务
17+阅读 · 2025年9月13日
扩散模型概述:应用、引导生成、统计率和优化
专知会员服务
47+阅读 · 2024年4月14日
集成学习研究现状及展望
专知会员服务
58+阅读 · 2023年7月20日
【2023新书】机器学习集成方法,354页pdf
专知会员服务
184+阅读 · 2023年4月11日
专知会员服务
26+阅读 · 2021年5月23日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员