具有可证明保证的决策树主动学习 (Active Learning for Decision Trees with Provable Guarantees) - 专知论文

会员服务 ·

0

决策树 · 主动学习 · 算法 · 分类器 · 分析 ·

Active Learning for Decision Trees with Provable Guarantees

翻译：具有可证明保证的决策树主动学习

Arshia Soltani Moakhar,Tanapoom Laoaron,Faraz Ghahremani,Kiarash Banihashem,MohammadTaghi Hajiaghayi

from arxiv, 10 pages, 43 pages with appendix, ICLR 2026, Conference URL: https://openreview.net/forum?id=NOkjJPJIit

This paper advances the theoretical understanding of active learning label complexity for decision trees as binary classifiers. We make two main contributions. First, we provide the first analysis of the disagreement coefficient for decision trees-a key parameter governing active learning label complexity. Our analysis holds under two natural assumptions required for achieving polylogarithmic label complexity, (i) each root-to-leaf path queries distinct feature dimensions, and (ii) the input data has a regular, grid-like structure. We show these assumptions are essential, as relaxing them leads to polynomial label complexity. Second, we present the first general active learning algorithm for binary classification that achieves a multiplicative error guarantee, producing a $(1+ε)$-approximate classifier. By combining these results, we design an active learning algorithm for decision trees that uses only a polylogarithmic number of label queries in the dataset size, under the stated assumptions. Finally, we establish a label complexity lower bound, showing our algorithm's dependence on the error tolerance $ε$ is close to optimal.

翻译：本文推进了对决策树作为二元分类器的主动学习标签复杂度的理论理解。我们做出了两项主要贡献。首先，我们首次分析了决策树的不一致系数——这是控制主动学习标签复杂度的关键参数。我们的分析在实现多对数标签复杂度所需的两项自然假设下成立：(i) 每条从根节点到叶节点的路径查询不同的特征维度，以及 (ii) 输入数据具有规则的网格状结构。我们证明了这些假设是必要的，因为放宽它们会导致多项式标签复杂度。其次，我们提出了首个用于二元分类的通用主动学习算法，该算法实现了乘法误差保证，能产生一个$(1+ε)$-近似分类器。通过结合这些结果，我们设计了一种用于决策树的主动学习算法，在所述假设下，该算法仅使用数据集大小的多对数数量级的标签查询。最后，我们建立了一个标签复杂度下界，表明我们算法对误差容忍度$ε$的依赖接近最优。

0

相关内容

决策树

决策树(Decision Tree）是在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干，故称决策树。在机器学习中，决策树是一个预测模型，他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度，使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。决策树是一种树形结构，其中每个内部节点表示一个属性上的测试，每个分支代表一个测试输出，每个叶节点代表一种类别。分类树（决策树）是一种十分常用的分类方法。他是一种监管学习，所谓监管学习就是给定一堆样本，每个样本都有一组属性和一个类别，这些类别是事先确定的，那么通过学习得到一个分类器，这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

专知会员服务

33+阅读 · 2024年10月10日

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

专知会员服务

26+阅读 · 2023年8月1日

【2023新书】不确定性决策与强化学习:理论与算法，251页pdf

【2023新书】不确定性决策与强化学习:理论与算法，251页pdf

专知会员服务

121+阅读 · 2023年6月1日

不确定性决策学习，普林斯顿Bartolomeo Stellato讲授，附Slides与视频

不确定性决策学习，普林斯顿Bartolomeo Stellato讲授，附Slides与视频

专知会员服务

49+阅读 · 2023年3月6日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知会员服务

260+阅读 · 2022年8月23日

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

专知会员服务

108+阅读 · 2022年6月17日

【经典书】主动学习理论，226页pdf，Theory of Active Learning

【经典书】主动学习理论，226页pdf，Theory of Active Learning

专知会员服务

129+阅读 · 2021年7月14日

基于决策树模型重用的分布变化流数据学习

专知会员服务

24+阅读 · 2021年1月30日

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

专知会员服务

22+阅读 · 2020年1月15日

【斯坦福大学】对抗性表征主动学习，Adversarial Representation Active Learning

【斯坦福大学】对抗性表征主动学习，Adversarial Representation Active Learning

专知会员服务

45+阅读 · 2019年12月20日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

49+阅读 · 2022年11月16日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【资源】元学习论文分类列表推荐

【资源】元学习论文分类列表推荐

专知

19+阅读 · 2019年12月3日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

半监督多任务学习：Semisupervised Multitask Learning

半监督多任务学习：Semisupervised Multitask Learning

我爱读PAMI

18+阅读 · 2018年4月29日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

群体偏好的敏感性度量方法研究和群决策方法的可实施性评价

国家自然科学基金

0+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

多标签降维中的多重代价敏感学习问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

云环境多用户的情景化动态信任决策模型及算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

16+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

Active Learning for Decision Trees with Provable Guarantees

Arxiv

0+阅读 · 2月18日

Classification Trees with Valid Inference via the Exponential Mechanism

Arxiv

0+阅读 · 2月17日

Progress Constraints for Reinforcement Learning in Behavior Trees

Arxiv

0+阅读 · 2月11日

Data-Aware and Scalable Sensitivity Analysis for Decision Tree Ensembles

Arxiv

0+阅读 · 2月7日

The hybrid confirmation tree: A robust strategy for hybrid intelligence

Arxiv

0+阅读 · 2月2日

Uncertainty-Aware Extrapolation in Bayesian Oblique Trees

Arxiv

0+阅读 · 1月30日

Sufficient Decision Proxies for Decision-Focused Learning

Arxiv

0+阅读 · 1月28日

Expert Knowledge-Guided Decision Calibration for Accurate Fine-Grained Tree Species Classification

Arxiv

0+阅读 · 1月23日

Consistency of Honest Decision Trees and Random Forests

Arxiv

0+阅读 · 1月21日

Approximating splits for decision trees quickly in sparse data streams

Arxiv

0+阅读 · 1月18日

VIP会员

文章信息

相关主题

最新内容

美伊停火协议：评估、各方反应及美国会面临的问题

美伊停火协议：评估、各方反应及美国会面临的问题

专知会员服务

3+阅读 · 今天13:00

国外反无人机系统与技术动态

国外反无人机系统与技术动态

专知会员服务

2+阅读 · 今天12:48

世界无人无线电情报系统经验分析与实验实现（研究论文）

世界无人无线电情报系统经验分析与实验实现（研究论文）

专知会员服务

3+阅读 · 今天12:44

大规模作战行动中的战术作战评估（研究论文）

大规模作战行动中的战术作战评估（研究论文）

专知会员服务

3+阅读 · 今天12:21

（中文长文）城市战与小部队城市战术：来自俄乌战争的观察

（中文长文）城市战与小部队城市战术：来自俄乌战争的观察

专知会员服务

3+阅读 · 今天12:13

未来的海战无人自主系统

未来的海战无人自主系统

专知会员服务

2+阅读 · 今天12:05

美军多域作战现状分析：战略、概念还是幻想？

美军多域作战现状分析：战略、概念还是幻想？

专知会员服务

3+阅读 · 今天11:52

（中文万字长文）美智库：针对伊朗的防空作战分析（报告）

（中文万字长文）美智库：针对伊朗的防空作战分析（报告）

专知会员服务

15+阅读 · 今天7:12

无人机与反无人机系统（书籍）

无人机与反无人机系统（书籍）

专知会员服务

14+阅读 · 今天6:45

（中文万字长文）2025-2026年乌克兰无人机拦截技术演进：反无人机技术、项目、效果、西方援助

（中文万字长文）2025-2026年乌克兰无人机拦截技术演进：反无人机技术、项目、效果、西方援助

专知会员服务

6+阅读 · 今天6:12

美陆军2026条令：安全与机动支援

美陆军2026条令：安全与机动支援

专知会员服务

5+阅读 · 今天5:49

【牛津博士论文】以语言为接口的医学影像表示学习

【牛津博士论文】以语言为接口的医学影像表示学习

专知会员服务

11+阅读 · 4月13日

基于大语言模型的医疗推理研究：综述与 MR-Bench 基准测试

基于大语言模型的医疗推理研究：综述与 MR-Bench 基准测试

专知会员服务

9+阅读 · 4月13日

从原型到实战：扩展美陆军下一代指挥控制能力（试验进展）

从原型到实战：扩展美陆军下一代指挥控制能力（试验进展）

专知会员服务

12+阅读 · 4月13日

技术、多域威慑与海上战争（报告）

技术、多域威慑与海上战争（报告）

专知会员服务

8+阅读 · 4月13日

相关VIP内容

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

【伯克利博士论文】通过强化学习实现安全且可信的决策制定

专知会员服务

33+阅读 · 2024年10月10日

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

《目标搜索网格世界中决策复杂性的影响：基于实例的学习与强化学习智能体的比较》CMU动态决策实验室

专知会员服务

26+阅读 · 2023年8月1日

【2023新书】不确定性决策与强化学习:理论与算法，251页pdf

【2023新书】不确定性决策与强化学习:理论与算法，251页pdf

专知会员服务

121+阅读 · 2023年6月1日

不确定性决策学习，普林斯顿Bartolomeo Stellato讲授，附Slides与视频

不确定性决策学习，普林斯顿Bartolomeo Stellato讲授，附Slides与视频

专知会员服务

49+阅读 · 2023年3月6日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知会员服务

260+阅读 · 2022年8月23日

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

专知会员服务

108+阅读 · 2022年6月17日

【经典书】主动学习理论，226页pdf，Theory of Active Learning

【经典书】主动学习理论，226页pdf，Theory of Active Learning

专知会员服务

129+阅读 · 2021年7月14日

基于决策树模型重用的分布变化流数据学习

专知会员服务

24+阅读 · 2021年1月30日

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

专知会员服务

22+阅读 · 2020年1月15日

【斯坦福大学】对抗性表征主动学习，Adversarial Representation Active Learning

【斯坦福大学】对抗性表征主动学习，Adversarial Representation Active Learning

专知会员服务

45+阅读 · 2019年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

国外反无人机系统与技术动态

大规模作战行动中的战术作战评估（研究论文）

美伊停火协议：评估、各方反应及美国会面临的问题

世界无人无线电情报系统经验分析与实验实现（研究论文）

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

49+阅读 · 2022年11月16日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

【资源】元学习论文分类列表推荐

【资源】元学习论文分类列表推荐

专知

19+阅读 · 2019年12月3日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

半监督多任务学习：Semisupervised Multitask Learning

半监督多任务学习：Semisupervised Multitask Learning

我爱读PAMI

18+阅读 · 2018年4月29日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

相关论文

Active Learning for Decision Trees with Provable Guarantees

Arxiv

0+阅读 · 2月18日

Classification Trees with Valid Inference via the Exponential Mechanism

Arxiv

0+阅读 · 2月17日

Progress Constraints for Reinforcement Learning in Behavior Trees

Arxiv

0+阅读 · 2月11日

Data-Aware and Scalable Sensitivity Analysis for Decision Tree Ensembles

Arxiv

0+阅读 · 2月7日

The hybrid confirmation tree: A robust strategy for hybrid intelligence

Arxiv

0+阅读 · 2月2日

Uncertainty-Aware Extrapolation in Bayesian Oblique Trees

Arxiv

0+阅读 · 1月30日

Sufficient Decision Proxies for Decision-Focused Learning

Arxiv

0+阅读 · 1月28日

Expert Knowledge-Guided Decision Calibration for Accurate Fine-Grained Tree Species Classification

Arxiv

0+阅读 · 1月23日

Consistency of Honest Decision Trees and Random Forests

Arxiv

0+阅读 · 1月21日

Approximating splits for decision trees quickly in sparse data streams

Arxiv

0+阅读 · 1月18日

相关基金

群体偏好的敏感性度量方法研究和群决策方法的可实施性评价

国家自然科学基金

0+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

多标签降维中的多重代价敏感学习问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

云环境多用户的情景化动态信任决策模型及算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

16+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员