An Efficient Algorithm for Thresholding Monte Carlo Tree Search - 专知论文

会员服务 ·

0

阈值 · 蒙特卡洛 · 蒙特卡洛树搜索 · 搜索 · 算法 ·

An Efficient Algorithm for Thresholding Monte Carlo Tree Search

翻译：一种用于阈值蒙特卡洛树搜索的高效算法

Shoma Nameki,Atsuyoshi Nakamura,Junpei Komiyama,Koji Tabata

We introduce the Thresholding Monte Carlo Tree Search problem, in which, given a tree $\mathcal{T}$ and a threshold $θ$, a player must answer whether the root node value of $\mathcal{T}$ is at least $θ$ or not. In the given tree, `MAX' or `MIN' is labeled on each internal node, and the value of a `MAX'-labeled (`MIN'-labeled) internal node is the maximum (minimum) of its child values. The value of a leaf node is the mean reward of an unknown distribution, from which the player can sample rewards. For this problem, we develop a $δ$-correct sequential sampling algorithm based on the Track-and-Stop strategy that has asymptotically optimal sample complexity. We show that a ratio-based modification of the D-Tracking arm-pulling strategy leads to a substantial improvement in empirical sample complexity, as well as reducing the per-round computational cost from linear to logarithmic in the number of arms.

翻译：我们引入了阈值蒙特卡洛树搜索问题，其中给定一棵树 $\mathcal{T}$ 和一个阈值 $θ$，玩家必须判断 $\mathcal{T}$ 的根节点值是否至少为 $θ$。在给定的树中，每个内部节点被标记为“MAX”或“MIN”，标记为“MAX”（“MIN”）的内部节点的值是其子节点值的最大值（最小值）。叶节点的值是一个未知分布的期望奖励，玩家可以从中采样奖励。针对该问题，我们基于Track-and-Stop策略开发了一种具有渐近最优样本复杂度的$δ$-正确序贯采样算法。我们证明，对D-Tracking臂选择策略进行基于比率的修改，可显著改善实际样本复杂度，同时将每轮计算成本从臂数量的线性降低至对数级。

0

相关内容

【DeepMind教程】蒙特卡罗树搜索，60页ppt

专知会员服务

60+阅读 · 2021年4月7日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

【KDD2020】基于矩阵和张量因子分解的高效自动机器学习搜索，Efficient AutoML Pipeline Search with Matrix and Tensor Factorization

【KDD2020】基于矩阵和张量因子分解的高效自动机器学习搜索，Efficient AutoML Pipeline Search with Matrix and Tensor Factorization

专知会员服务

13+阅读 · 2020年6月10日

用于大型遥感影像检索的深度学习，Deep Learning for Image Search and Retrieval in Large Remote Sensing Archives

用于大型遥感影像检索的深度学习，Deep Learning for Image Search and Retrieval in Large Remote Sensing Archives

专知会员服务

39+阅读 · 2020年4月6日

【Google 大脑】使用上千个优化任务学习超参数搜索策略，Using a thousand optimization tasks to learn hyperparameter search strategies

【Google 大脑】使用上千个优化任务学习超参数搜索策略，Using a thousand optimization tasks to learn hyperparameter search strategies

专知会员服务

18+阅读 · 2020年3月14日

【SIGMOD2020-CMU】在内存中搜索树的顺序保持键压缩，Order-Preserving Key Compression for In-Memory Search Trees

【SIGMOD2020-CMU】在内存中搜索树的顺序保持键压缩，Order-Preserving Key Compression for In-Memory Search Trees

专知会员服务

15+阅读 · 2020年3月7日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【清华大学】自动微分蒙特卡洛，理论与应用，Automatic Differentiable Monte Carlo: Theory and Application (附pdf）

专知会员服务

28+阅读 · 2019年11月23日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

基于图神经网络的推荐算法总结

基于图神经网络的推荐算法总结

机器学习与推荐算法

25+阅读 · 2021年9月30日

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

专知

29+阅读 · 2019年9月25日

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

极市平台

30+阅读 · 2019年4月20日

推荐：使用Python实现机器学习特征选择的4种方法（附代码）

推荐：使用Python实现机器学习特征选择的4种方法（附代码）

数据分析

12+阅读 · 2019年4月14日

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

泡泡机器人SLAM

11+阅读 · 2019年1月20日

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

泡泡机器人SLAM

11+阅读 · 2018年12月10日

2018年6月13日精彩内容推荐（蒙特卡洛方法教程、2018深度学习视频行为识别概述等）

2018年6月13日精彩内容推荐（蒙特卡洛方法教程、2018深度学习视频行为识别概述等）

Chatbots技术与产品

42+阅读 · 2018年6月13日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

不用数学也能讲清贝叶斯理论的马尔可夫链蒙特卡洛方法？这篇文章做到了

不用数学也能讲清贝叶斯理论的马尔可夫链蒙特卡洛方法？这篇文章做到了

AI100

11+阅读 · 2017年12月24日

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

机器学习研究会

12+阅读 · 2017年11月3日

基于深度学习的金丝猴面部特性的检测与识别算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

树上生灭过程收敛速度及p-Laplacian特征值估计

国家自然科学基金

0+阅读 · 2015年12月31日

基于高效蒙特卡罗策略的最优化方法及应用研究

国家自然科学基金

9+阅读 · 2015年12月31日

一类大规模实对称锥规划算法

国家自然科学基金

0+阅读 · 2015年12月31日

随机波动率模型下金融衍生产品定价中的条件蒙特卡罗加速方法

国家自然科学基金

1+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于马尔科夫链的线性系统求解问题的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机Helmholtz型问题的数值方法

国家自然科学基金

0+阅读 · 2014年12月31日

Practical MCTS-based Query Optimization: A Reproducibility Study and new MCTS algorithm for complex queries

Arxiv

0+阅读 · 3月17日

Rooting Out Entropy: Optimal Tree Extraction for Ultra-Succinct Graphs

Arxiv

0+阅读 · 3月15日

Better Learning-Augmented Spanning Tree Algorithms via Metric Forest Completion

Arxiv

0+阅读 · 2月27日

OrderedCuts: A new approach for computing Gomory-Hu tree

Arxiv

0+阅读 · 2月24日

A computational study of Gomory-Hu construction tree algorithms

Arxiv

0+阅读 · 2月24日

Twice Sequential Monte Carlo for Tree Search

Arxiv

0+阅读 · 2月9日

Approximate Cartesian Tree Matching with Substitutions

Arxiv

0+阅读 · 2月9日

Efficient Online Variational Estimation via Monte Carlo Sampling

Arxiv

0+阅读 · 2月6日

Entropic Risk-Aware Monte Carlo Tree Search

Arxiv

0+阅读 · 2月5日

Fast Compute via MC Boosting

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

蒙特卡洛树搜索

最新内容

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

专知会员服务

4+阅读 · 今天5:18

美海警海上态势感知无人系统

美海警海上态势感知无人系统

专知会员服务

2+阅读 · 今天5:10

《释放自主力量：将人工智能驱动无人机融入现代军事战略》

《释放自主力量：将人工智能驱动无人机融入现代军事战略》

专知会员服务

7+阅读 · 今天3:44

《智能作战任务规划技术：实验流程与发现》50页报告

《智能作战任务规划技术：实验流程与发现》50页报告

专知会员服务

12+阅读 · 今天3:40

《复杂系统数据驱动预测建模的数值框架》报告

《复杂系统数据驱动预测建模的数值框架》报告

专知会员服务

5+阅读 · 今天3:37

从“会话式人工智能”角度看“Maven智能系统”

从“会话式人工智能”角度看“Maven智能系统”

专知会员服务

3+阅读 · 今天3:02

《仿真互操作性就绪水平（SIRL）标准用户指南：评估分布式仿真集成的互操作性风险》

《仿真互操作性就绪水平（SIRL）标准用户指南：评估分布式仿真集成的互操作性风险》

专知会员服务

7+阅读 · 今天2:57

《无人机母舰：一种新兴的海军平台》报告

《无人机母舰：一种新兴的海军平台》报告

专知会员服务

4+阅读 · 今天2:51

【ICLR2026】基于小型语言模型的终身智能体

【ICLR2026】基于小型语言模型的终身智能体

专知会员服务

10+阅读 · 4月27日

ICLR 2026获奖论文揭晓：两篇杰出论文，大神Alec Radford经典工作获时间检验奖

ICLR 2026获奖论文揭晓：两篇杰出论文，大神Alec Radford经典工作获时间检验奖

专知会员服务

6+阅读 · 4月27日

全面的反无人机系统培训计划

全面的反无人机系统培训计划

专知会员服务

2+阅读 · 4月27日

数字孪生在军事领域的应用综述：陆地、海上、空中、太空和网络空间多域赋能

数字孪生在军事领域的应用综述：陆地、海上、空中、太空和网络空间多域赋能

专知会员服务

7+阅读 · 4月27日

《美国首席数字与人工智能办公室（CDAO）人工智能治理与采办流程效能评估》报告

《美国首席数字与人工智能办公室（CDAO）人工智能治理与采办流程效能评估》报告

专知会员服务

11+阅读 · 4月27日

算法战加速推进：五角大楼项目、供应商生态体系与军事创新的战略重塑

算法战加速推进：五角大楼项目、供应商生态体系与军事创新的战略重塑

专知会员服务

6+阅读 · 4月27日

探秘Palantir：驱动美情报的科技巨头

探秘Palantir：驱动美情报的科技巨头

专知会员服务

4+阅读 · 4月27日

相关VIP内容

【DeepMind教程】蒙特卡罗树搜索，60页ppt

专知会员服务

60+阅读 · 2021年4月7日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

【KDD2020】基于矩阵和张量因子分解的高效自动机器学习搜索，Efficient AutoML Pipeline Search with Matrix and Tensor Factorization

【KDD2020】基于矩阵和张量因子分解的高效自动机器学习搜索，Efficient AutoML Pipeline Search with Matrix and Tensor Factorization

专知会员服务

13+阅读 · 2020年6月10日

用于大型遥感影像检索的深度学习，Deep Learning for Image Search and Retrieval in Large Remote Sensing Archives

用于大型遥感影像检索的深度学习，Deep Learning for Image Search and Retrieval in Large Remote Sensing Archives

专知会员服务

39+阅读 · 2020年4月6日

【Google 大脑】使用上千个优化任务学习超参数搜索策略，Using a thousand optimization tasks to learn hyperparameter search strategies

【Google 大脑】使用上千个优化任务学习超参数搜索策略，Using a thousand optimization tasks to learn hyperparameter search strategies

专知会员服务

18+阅读 · 2020年3月14日

【SIGMOD2020-CMU】在内存中搜索树的顺序保持键压缩，Order-Preserving Key Compression for In-Memory Search Trees

【SIGMOD2020-CMU】在内存中搜索树的顺序保持键压缩，Order-Preserving Key Compression for In-Memory Search Trees

专知会员服务

15+阅读 · 2020年3月7日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【清华大学】自动微分蒙特卡洛，理论与应用，Automatic Differentiable Monte Carlo: Theory and Application (附pdf）

专知会员服务

28+阅读 · 2019年11月23日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

美海警海上态势感知无人系统

《智能作战任务规划技术：实验流程与发现》50页报告

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

《释放自主力量：将人工智能驱动无人机融入现代军事战略》

相关资讯

基于图神经网络的推荐算法总结

基于图神经网络的推荐算法总结

机器学习与推荐算法

25+阅读 · 2021年9月30日

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

专知

29+阅读 · 2019年9月25日

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

极市平台

30+阅读 · 2019年4月20日

推荐：使用Python实现机器学习特征选择的4种方法（附代码）

推荐：使用Python实现机器学习特征选择的4种方法（附代码）

数据分析

12+阅读 · 2019年4月14日

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

【泡泡图灵智库】PointNet：用于三维分类与分割的点集深度学习（CVPR）

泡泡机器人SLAM

11+阅读 · 2019年1月20日

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

泡泡机器人SLAM

11+阅读 · 2018年12月10日

2018年6月13日精彩内容推荐（蒙特卡洛方法教程、2018深度学习视频行为识别概述等）

2018年6月13日精彩内容推荐（蒙特卡洛方法教程、2018深度学习视频行为识别概述等）

Chatbots技术与产品

42+阅读 · 2018年6月13日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

不用数学也能讲清贝叶斯理论的马尔可夫链蒙特卡洛方法？这篇文章做到了

不用数学也能讲清贝叶斯理论的马尔可夫链蒙特卡洛方法？这篇文章做到了

AI100

11+阅读 · 2017年12月24日

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

机器学习研究会

12+阅读 · 2017年11月3日

相关论文

Practical MCTS-based Query Optimization: A Reproducibility Study and new MCTS algorithm for complex queries

Arxiv

0+阅读 · 3月17日

Rooting Out Entropy: Optimal Tree Extraction for Ultra-Succinct Graphs

Arxiv

0+阅读 · 3月15日

Better Learning-Augmented Spanning Tree Algorithms via Metric Forest Completion

Arxiv

0+阅读 · 2月27日

OrderedCuts: A new approach for computing Gomory-Hu tree

Arxiv

0+阅读 · 2月24日

A computational study of Gomory-Hu construction tree algorithms

Arxiv

0+阅读 · 2月24日

Twice Sequential Monte Carlo for Tree Search

Arxiv

0+阅读 · 2月9日

Approximate Cartesian Tree Matching with Substitutions

Arxiv

0+阅读 · 2月9日

Efficient Online Variational Estimation via Monte Carlo Sampling

Arxiv

0+阅读 · 2月6日

Entropic Risk-Aware Monte Carlo Tree Search

Arxiv

0+阅读 · 2月5日

Fast Compute via MC Boosting

Arxiv

0+阅读 · 2月4日

相关基金

基于深度学习的金丝猴面部特性的检测与识别算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

树上生灭过程收敛速度及p-Laplacian特征值估计

国家自然科学基金

0+阅读 · 2015年12月31日

基于高效蒙特卡罗策略的最优化方法及应用研究

国家自然科学基金

9+阅读 · 2015年12月31日

一类大规模实对称锥规划算法

国家自然科学基金

0+阅读 · 2015年12月31日

随机波动率模型下金融衍生产品定价中的条件蒙特卡罗加速方法

国家自然科学基金

1+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于马尔科夫链的线性系统求解问题的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机Helmholtz型问题的数值方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员