XGBoost 学习何种函数？ (What Functions Does XGBoost Learn?) - 专知论文

会员服务 ·

0

xgboost · 度量 · 罚项 · 优化器 · 极大 ·

What Functions Does XGBoost Learn?

翻译：XGBoost 学习何种函数？

Dohyeong Ki,Adityanand Guntuboyina

This paper establishes a rigorous theoretical foundation for the function class implicitly learned by XGBoost, bridging the gap between its empirical success and our theoretical understanding. We introduce an infinite-dimensional function class $\mathcal{F}^{d, s}_{\infty-\text{ST}}$ that extends finite ensembles of bounded-depth regression trees, together with a complexity measure $V^{d, s}_{\infty-\text{XGB}}(\cdot)$ that generalizes the $L^1$ regularization penalty used in XGBoost. We show that every optimizer of the XGBoost objective is also an optimizer of an equivalent penalized regression problem over $\mathcal{F}^{d, s}_{\infty-\text{ST}}$ with penalty $V^{d, s}_{\infty-\text{XGB}}(\cdot)$, providing an interpretation of XGBoost as implicitly targeting a broader function class. We also develop a smoothness-based interpretation of $\mathcal{F}^{d, s}_{\infty-\text{ST}}$ and $V^{d, s}_{\infty-\text{XGB}}(\cdot)$ in terms of Hardy--Krause variation. We prove that the least squares estimator over $\{f \in \mathcal{F}^{d, s}_{\infty-\text{ST}}: V^{d, s}_{\infty-\text{XGB}}(f) \le V\}$ achieves a nearly minimax-optimal rate of convergence $n^{-2/3} (\log n)^{4(\min(s, d) - 1)/3}$, thereby avoiding the curse of dimensionality. Our results provide the first rigorous characterization of the function space underlying XGBoost, clarify its connection to classical notions of variation, and identify an important open problem: whether the XGBoost algorithm itself achieves minimax optimality over this class.

翻译：本文为 XGBoost 隐式学习的函数类建立了严格的理论基础，弥合了其经验成功与理论理解之间的差距。我们引入了一个无限维函数类 $\mathcal{F}^{d, s}_{\infty-\text{ST}}$，它扩展了有限的有界深度回归树集成，并引入了一个复杂度度量 $V^{d, s}_{\infty-\text{XGB}}(\cdot)$，该度量推广了 XGBoost 中使用的 $L^1$ 正则化惩罚项。我们证明，XGBoost 目标函数的每个优化器，也是具有惩罚项 $V^{d, s}_{\infty-\text{XGB}}(\cdot)$ 的、在 $\mathcal{F}^{d, s}_{\infty-\text{ST}}$ 上的等价惩罚回归问题的优化器，从而将 XGBoost 解释为隐式地瞄准了一个更广泛的函数类。我们还基于光滑性，利用 Hardy--Krause 变差对 $\mathcal{F}^{d, s}_{\infty-\text{ST}}$ 和 $V^{d, s}_{\infty-\text{XGB}}(\cdot)$ 给出了解释。我们证明了在集合 $\{f \in \mathcal{F}^{d, s}_{\infty-\text{ST}}: V^{d, s}_{\infty-\text{XGB}}(f) \le V\}$ 上的最小二乘估计器达到了近乎极小极大最优的收敛速率 $n^{-2/3} (\log n)^{4(\min(s, d) - 1)/3}$，从而避免了维度灾难。我们的结果首次对 XGBoost 背后的函数空间进行了严格的刻画，阐明了其与经典变差概念的联系，并指出了一个重要的开放性问题：XGBoost 算法本身是否能在该类上达到极小极大最优性。

0

相关内容

xgboost

xgboost的全称是eXtreme Gradient Boosting，它是Gradient Boosting Machine的一个C++实现，并能够自动利用CPU的多线程进行并行，同时在算法上加以改进提高了精度。

【牛津大学博士论文】机器学习中的组合性和函数不变量，224页pdf

【牛津大学博士论文】机器学习中的组合性和函数不变量，224页pdf

专知会员服务

45+阅读 · 2023年3月25日

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

专知会员服务

70+阅读 · 2023年1月17日

【干货书】Python代数和几何，429页pdf

【干货书】Python代数和几何，429页pdf

专知会员服务

78+阅读 · 2023年1月8日

几何观点下的深度学习

几何观点下的深度学习

专知会员服务

36+阅读 · 2022年12月13日

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

专知会员服务

34+阅读 · 2022年8月10日

【干货书】《XcalableMP PGAS编程语言》，265页pdf，XcalableMP PGAS Programming Language

【干货书】《XcalableMP PGAS编程语言》，265页pdf，XcalableMP PGAS Programming Language

专知会员服务

11+阅读 · 2022年3月24日

重磅！《几何深度学习》课程发布！帝国理工/DeepMind等图ML大牛共同讲授: 从图几何到深度学习

重磅！《几何深度学习》课程发布！帝国理工/DeepMind等图ML大牛共同讲授: 从图几何到深度学习

专知会员服务

82+阅读 · 2021年8月9日

【经典书】线性代数，399页pdf，Georgi Shilov经典本科教材

【经典书】线性代数，399页pdf，Georgi Shilov经典本科教材

专知会员服务

77+阅读 · 2021年3月2日

系列教程GNN-algorithms之四：《Inductive Learning 大神—GraphSAGE》

系列教程GNN-algorithms之四：《Inductive Learning 大神—GraphSAGE》

专知会员服务

40+阅读 · 2020年8月6日

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

专知会员服务

44+阅读 · 2020年3月4日

【必修】16个机器学习算法推导及项目案例 XGBoost | GBDT ......

【必修】16个机器学习算法推导及项目案例 XGBoost | GBDT ......

计算机视觉life

12+阅读 · 2019年10月15日

R语言机器学习：xgboost的使用及其模型解释

R语言机器学习：xgboost的使用及其模型解释

R语言中文社区

11+阅读 · 2019年5月6日

今日面试题分享：为什么xgboost要用泰勒展开，优势在哪里？

今日面试题分享：为什么xgboost要用泰勒展开，优势在哪里？

七月在线实验室

22+阅读 · 2019年3月13日

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

七月在线实验室

11+阅读 · 2019年3月12日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

计算：XGBoost背后的数学之美

计算：XGBoost背后的数学之美

论智

12+阅读 · 2018年8月20日

【Python实战】无监督学习—聚类、层次聚类、t-SNE，DBSCAN

【Python实战】无监督学习—聚类、层次聚类、t-SNE，DBSCAN

专知

13+阅读 · 2018年6月18日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

xgboost特征选择

xgboost特征选择

数据挖掘入门与实战

39+阅读 · 2017年10月5日

LibRec 每周算法：Kaggle竞赛利器之xgboost

LibRec 每周算法：Kaggle竞赛利器之xgboost

LibRec智能推荐

15+阅读 · 2017年8月24日

概率和平均框架下一系列Sobolev空间中的函数逼近与恢复

国家自然科学基金

1+阅读 · 2015年12月31日

几类随机指数函数空间的应用

国家自然科学基金

0+阅读 · 2015年12月31日

函数数据变换模型及降维方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

光滑函数类的熵数估计

国家自然科学基金

0+阅读 · 2015年12月31日

函数逼近论的一些极值问题与多元线性问题的可处理性

国家自然科学基金

2+阅读 · 2014年12月31日

函数空间、几何和Mahler测度

国家自然科学基金

0+阅读 · 2014年12月31日

莫比乌斯不变空间上复合算子若干问题

国家自然科学基金

0+阅读 · 2014年12月31日

高维代数簇的相关问题

国家自然科学基金

0+阅读 · 2014年12月31日

套子代数的Hochschild上同调及套的分类

国家自然科学基金

3+阅读 · 2014年12月31日

函数空间的拓扑分类

国家自然科学基金

1+阅读 · 2014年12月31日

ZKBoost: Zero-Knowledge Verifiable Training for XGBoost

Arxiv

0+阅读 · 2月4日

Clonoids over vector spaces

Arxiv

0+阅读 · 2月3日

Approximation of Functions: Optimal Sampling and Complexity

Arxiv

0+阅读 · 2月2日

Learning Functional Graphs with Nonlinear Sufficient Dimension Reduction

Arxiv

0+阅读 · 1月22日

Functional Logic Program Transformations

Arxiv

0+阅读 · 1月19日

Learning Regularization Functionals for Inverse Problems: A Comparative Study

Arxiv

0+阅读 · 1月15日

Divergence-Based Similarity Function for Multi-View Contrastive Learning

Arxiv

0+阅读 · 1月14日

Statistical learning on measures: an application to persistence diagrams

Arxiv

0+阅读 · 1月12日

An Algebraic Representation Theorem for Linear GENEOs in Geometric Machine Learning

Arxiv

0+阅读 · 1月7日

The Zero-Difference Properties of Functions and Their Applications

Arxiv

0+阅读 · 2025年12月30日

VIP会员

文章信息

相关主题

最新内容

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

专知会员服务

2+阅读 · 今天14:59

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

专知会员服务

2+阅读 · 今天14:21

美陆军设想无人系统司令部

美陆军设想无人系统司令部

专知会员服务

1+阅读 · 今天13:45

【博士论文】已对齐人工智能系统的持久脆弱性

【博士论文】已对齐人工智能系统的持久脆弱性

专知会员服务

0+阅读 · 今天13:52

人工智能对指挥控制的加速及其对陆军的影响（中文报告）

人工智能对指挥控制的加速及其对陆军的影响（中文报告）

专知会员服务

2+阅读 · 今天13:39

扭曲还是编造？视频大语言模型幻觉研究综述

扭曲还是编造？视频大语言模型幻觉研究综述

专知会员服务

0+阅读 · 今天13:41

美欧最新（2026）反无人机系统选项、技术与获取一览

美欧最新（2026）反无人机系统选项、技术与获取一览

专知会员服务

2+阅读 · 今天13:13

《大语言模型作为战术规划支持工具——来自两项应用研究的结论》2026最新100页报告

《大语言模型作为战术规划支持工具——来自两项应用研究的结论》2026最新100页报告

专知会员服务

2+阅读 · 今天13:11

《采用系统思维应对混合战争》125页

《采用系统思维应对混合战争》125页

专知会员服务

2+阅读 · 今天12:47

战争机器学习：数据生态系统构建（155页）

战争机器学习：数据生态系统构建（155页）

专知会员服务

6+阅读 · 今天8:10

乌克兰军事人工智能助手：NeoLens军事装备人工智能辅助维护平台

乌克兰军事人工智能助手：NeoLens军事装备人工智能辅助维护平台

专知会员服务

2+阅读 · 今天7:40

2026 年 Agentic AI 工程师完全指南：一份系统化的学习路线图

2026 年 Agentic AI 工程师完全指南：一份系统化的学习路线图

专知会员服务

13+阅读 · 4月14日

内省扩散语言模型

内省扩散语言模型

专知会员服务

5+阅读 · 4月14日

美伊停火协议：评估、各方反应及美国会面临的问题

美伊停火协议：评估、各方反应及美国会面临的问题

专知会员服务

4+阅读 · 4月14日

国外反无人机系统与技术动态

国外反无人机系统与技术动态

专知会员服务

4+阅读 · 4月14日

相关VIP内容

【牛津大学博士论文】机器学习中的组合性和函数不变量，224页pdf

【牛津大学博士论文】机器学习中的组合性和函数不变量，224页pdf

专知会员服务

45+阅读 · 2023年3月25日

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

专知会员服务

70+阅读 · 2023年1月17日

【干货书】Python代数和几何，429页pdf

【干货书】Python代数和几何，429页pdf

专知会员服务

78+阅读 · 2023年1月8日

几何观点下的深度学习

几何观点下的深度学习

专知会员服务

36+阅读 · 2022年12月13日

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

专知会员服务

34+阅读 · 2022年8月10日

【干货书】《XcalableMP PGAS编程语言》，265页pdf，XcalableMP PGAS Programming Language

【干货书】《XcalableMP PGAS编程语言》，265页pdf，XcalableMP PGAS Programming Language

专知会员服务

11+阅读 · 2022年3月24日

重磅！《几何深度学习》课程发布！帝国理工/DeepMind等图ML大牛共同讲授: 从图几何到深度学习

重磅！《几何深度学习》课程发布！帝国理工/DeepMind等图ML大牛共同讲授: 从图几何到深度学习

专知会员服务

82+阅读 · 2021年8月9日

【经典书】线性代数，399页pdf，Georgi Shilov经典本科教材

【经典书】线性代数，399页pdf，Georgi Shilov经典本科教材

专知会员服务

77+阅读 · 2021年3月2日

系列教程GNN-algorithms之四：《Inductive Learning 大神—GraphSAGE》

系列教程GNN-algorithms之四：《Inductive Learning 大神—GraphSAGE》

专知会员服务

40+阅读 · 2020年8月6日

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

专知会员服务

44+阅读 · 2020年3月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

【博士论文】已对齐人工智能系统的持久脆弱性

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

美陆军设想无人系统司令部

相关资讯

【必修】16个机器学习算法推导及项目案例 XGBoost | GBDT ......

【必修】16个机器学习算法推导及项目案例 XGBoost | GBDT ......

计算机视觉life

12+阅读 · 2019年10月15日

R语言机器学习：xgboost的使用及其模型解释

R语言机器学习：xgboost的使用及其模型解释

R语言中文社区

11+阅读 · 2019年5月6日

今日面试题分享：为什么xgboost要用泰勒展开，优势在哪里？

今日面试题分享：为什么xgboost要用泰勒展开，优势在哪里？

七月在线实验室

22+阅读 · 2019年3月13日

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

今日面试题分享：请问（决策树、Random Forest、Booting、Adaboot）GBDT和XGBoost的区别是什么？

七月在线实验室

11+阅读 · 2019年3月12日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

计算：XGBoost背后的数学之美

计算：XGBoost背后的数学之美

论智

12+阅读 · 2018年8月20日

【Python实战】无监督学习—聚类、层次聚类、t-SNE，DBSCAN

【Python实战】无监督学习—聚类、层次聚类、t-SNE，DBSCAN

专知

13+阅读 · 2018年6月18日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

xgboost特征选择

xgboost特征选择

数据挖掘入门与实战

39+阅读 · 2017年10月5日

LibRec 每周算法：Kaggle竞赛利器之xgboost

LibRec 每周算法：Kaggle竞赛利器之xgboost

LibRec智能推荐

15+阅读 · 2017年8月24日

相关论文

ZKBoost: Zero-Knowledge Verifiable Training for XGBoost

Arxiv

0+阅读 · 2月4日

Clonoids over vector spaces

Arxiv

0+阅读 · 2月3日

Approximation of Functions: Optimal Sampling and Complexity

Arxiv

0+阅读 · 2月2日

Learning Functional Graphs with Nonlinear Sufficient Dimension Reduction

Arxiv

0+阅读 · 1月22日

Functional Logic Program Transformations

Arxiv

0+阅读 · 1月19日

Learning Regularization Functionals for Inverse Problems: A Comparative Study

Arxiv

0+阅读 · 1月15日

Divergence-Based Similarity Function for Multi-View Contrastive Learning

Arxiv

0+阅读 · 1月14日

Statistical learning on measures: an application to persistence diagrams

Arxiv

0+阅读 · 1月12日

An Algebraic Representation Theorem for Linear GENEOs in Geometric Machine Learning

Arxiv

0+阅读 · 1月7日

The Zero-Difference Properties of Functions and Their Applications

Arxiv

0+阅读 · 2025年12月30日

相关基金

概率和平均框架下一系列Sobolev空间中的函数逼近与恢复

国家自然科学基金

1+阅读 · 2015年12月31日

几类随机指数函数空间的应用

国家自然科学基金

0+阅读 · 2015年12月31日

函数数据变换模型及降维方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

光滑函数类的熵数估计

国家自然科学基金

0+阅读 · 2015年12月31日

函数逼近论的一些极值问题与多元线性问题的可处理性

国家自然科学基金

2+阅读 · 2014年12月31日

函数空间、几何和Mahler测度

国家自然科学基金

0+阅读 · 2014年12月31日

莫比乌斯不变空间上复合算子若干问题

国家自然科学基金

0+阅读 · 2014年12月31日

高维代数簇的相关问题

国家自然科学基金

0+阅读 · 2014年12月31日

套子代数的Hochschild上同调及套的分类

国家自然科学基金

3+阅读 · 2014年12月31日

函数空间的拓扑分类

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员