Frequentist Regret Analysis of Gaussian Process Thompson Sampling via Fractional Posteriors - 专知论文

会员服务 ·

0

分析 · 高斯过程 · 离散 · 离散化 · 3D ·

Frequentist Regret Analysis of Gaussian Process Thompson Sampling via Fractional Posteriors

翻译：基于分数后验的高斯过程汤普森采样频率主义遗憾分析

Somjit Roy,Prateek Jaiswal,Anirban Bhattacharya,Debdeep Pati,Bani K. Mallick

from arxiv, 34 pages, Submitted

We study Gaussian Process Thompson Sampling (GP-TS) for sequential decision-making over compact, continuous action spaces and provide a frequentist regret analysis based on fractional Gaussian process posteriors, without relying on domain discretization as in prior work. We show that the variance inflation commonly assumed in existing analyses of GP-TS can be interpreted as Thompson Sampling with respect to a fractional posterior with tempering parameter $α\in (0,1)$. We derive a kernel-agnostic regret bound expressed in terms of the information gain parameter $γ_t$ and the posterior contraction rate $ε_t$, and identify conditions on the Gaussian process prior under which $ε_t$ can be controlled. As special cases of our general bound, we recover regret of order $\tilde{\mathcal{O}}(T^{\frac{1}{2}})$ for the squared exponential kernel, $\tilde{\mathcal{O}}(T^{\frac{2ν+3d}{2(2ν+d)}} )$ for the Matérn-$ν$ kernel, and a bound of order $\tilde{\mathcal{O}}(T^{\frac{2ν+3d}{2(2ν+d)}})$ for the rational quadratic kernel. Overall, our analysis provides a unified and discretization-free regret framework for GP-TS that applies broadly across kernel classes.

翻译：本文研究高斯过程汤普森采样（GP-TS）在紧致连续动作空间上的序贯决策问题，并基于分数高斯过程后验给出频率主义遗憾分析，无需依赖现有工作中常用的域离散化方法。我们证明，现有GP-TS分析中通常假设的方差膨胀可解释为针对具有退火参数$α\in (0,1)$的分数后验执行汤普森采样。我们推导出用信息增益参数$γ_t$和后验收缩率$ε_t$表示的核无关遗憾界，并确定了能够控制$ε_t$的高斯过程先验条件。作为一般界的特例，我们恢复了平方指数核的$\tilde{\mathcal{O}}(T^{\frac{1}{2}})$阶遗憾、Matérn-$ν$核的$\tilde{\mathcal{O}}(T^{\frac{2ν+3d}{2(2ν+d)}} )$阶遗憾，以及有理二次核的$\tilde{\mathcal{O}}(T^{\frac{2ν+3d}{2(2ν+d)}})$阶遗憾界。总体而言，我们的分析为GP-TS提供了一个统一且无需离散化的遗憾分析框架，该框架广泛适用于各类核函数。

0

相关内容

【剑桥博士论文】可扩展高斯过程：迭代方法与路径条件的进展

【剑桥博士论文】可扩展高斯过程：迭代方法与路径条件的进展

专知会员服务

16+阅读 · 2025年7月10日

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

专知会员服务

20+阅读 · 2025年4月30日

【干货书】使用高斯过程模型的动态系统建模与控制，281页pdf

【干货书】使用高斯过程模型的动态系统建模与控制，281页pdf

专知会员服务

55+阅读 · 2022年5月23日

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

专知会员服务

22+阅读 · 2021年12月9日

最新《高斯过程回归简明教程》，19页pdf

最新《高斯过程回归简明教程》，19页pdf

专知会员服务

73+阅读 · 2020年9月30日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

【ICML2020投稿论文-DeepMind】时序差分学习的推理与泛化，Temporal Difference Learning

专知会员服务

26+阅读 · 2020年3月16日

【东京大学】图采样，Sampling on Graphs: From Theory to Applications

【东京大学】图采样，Sampling on Graphs: From Theory to Applications

专知会员服务

19+阅读 · 2020年3月10日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

专知会员服务

98+阅读 · 2019年11月19日

【干货书】贝叶斯推断随机过程，449页pdf

【干货书】贝叶斯推断随机过程，449页pdf

专知

31+阅读 · 2020年8月27日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

AINLP

15+阅读 · 2019年8月12日

解读 | 得见的高斯过程

解读 | 得见的高斯过程

机器学习算法与Python学习

14+阅读 · 2019年2月13日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

【论文推荐】最新八篇主题模型相关论文—主题建模优化、变分推断、情绪强度、神经语言模型、搜索、社区聚合、主题建模的问题、光谱学习

【论文推荐】最新八篇主题模型相关论文—主题建模优化、变分推断、情绪强度、神经语言模型、搜索、社区聚合、主题建模的问题、光谱学习

专知

13+阅读 · 2018年3月8日

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

极市平台

16+阅读 · 2018年1月20日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

14+阅读 · 2015年12月31日

高阶微分方程的周期解及多重性

国家自然科学基金

0+阅读 · 2015年12月31日

两类分数阶发展方程解的适定性及吸引子

国家自然科学基金

0+阅读 · 2015年12月31日

基于贝叶斯观点的分数阶扩散方程反问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

非高斯噪声中基于分数低阶统计量的频谱感知技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

高斯序列与过程的极值理论

国家自然科学基金

2+阅读 · 2015年12月31日

Ornstein-Uhlenbeck 型过程多变点检验及两样本检验问题

国家自然科学基金

1+阅读 · 2015年12月31日

分数阶薛定谔方程的数值方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高阶分数阶偏微分方程的全离散局部间断有限元方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶扩散方程反向问题的正则化理论与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Wasserstein-type Gaussian Process Regressions for Input Measurement Uncertainty

Wasserstein-type Gaussian Process Regressions for Input Measurement Uncertainty

Arxiv

0+阅读 · 3月18日

Adaptive Prior Selection in Gaussian Process Bandits with Thompson Sampling

Arxiv

0+阅读 · 3月12日

Vecchia Gaussian Processes: on probabilistic and statistical properties

Arxiv

0+阅读 · 3月11日

Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling

Arxiv

0+阅读 · 3月11日

Sparse Variational Student-t Processes for Heavy-tailed Modeling

Arxiv

0+阅读 · 3月10日

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Arxiv

0+阅读 · 3月10日

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Arxiv

0+阅读 · 3月9日

Empirical Gaussian Processes

Arxiv

0+阅读 · 2月12日

Thompson Sampling-Based Learning and Control for Unknown Dynamic Systems

Arxiv

0+阅读 · 2月5日

Thompson Sampling via Fine-Tuning of LLMs

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

2+阅读 · 今天7:11

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

4+阅读 · 今天6:56

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

2+阅读 · 今天4:16

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

9+阅读 · 今天3:36

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

4+阅读 · 今天3:21

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

6+阅读 · 今天3:13

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 今天2:55

《基于Transformer的异常舰船导航识别与跟踪》80页

《基于Transformer的异常舰船导航识别与跟踪》80页

专知会员服务

7+阅读 · 今天2:45

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

专知会员服务

6+阅读 · 今天2:41

《低数据领域军事目标检测模型研究》

《低数据领域军事目标检测模型研究》

专知会员服务

6+阅读 · 今天2:37

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

专知会员服务

6+阅读 · 今天2:32

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

10+阅读 · 4月22日

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

13+阅读 · 4月22日

伊朗战争停火期间美军关键弹药状况分析

伊朗战争停火期间美军关键弹药状况分析

专知会员服务

8+阅读 · 4月22日

电子战革命：塑造战场的十年突破（2015–2025）

电子战革命：塑造战场的十年突破（2015–2025）

专知会员服务

6+阅读 · 4月22日

相关VIP内容

【剑桥博士论文】可扩展高斯过程：迭代方法与路径条件的进展

【剑桥博士论文】可扩展高斯过程：迭代方法与路径条件的进展

专知会员服务

16+阅读 · 2025年7月10日

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

水下通信《通信感知、可扩展高斯过程在分布式探索中的应用》186页

专知会员服务

20+阅读 · 2025年4月30日

【干货书】使用高斯过程模型的动态系统建模与控制，281页pdf

【干货书】使用高斯过程模型的动态系统建模与控制，281页pdf

专知会员服务

55+阅读 · 2022年5月23日

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

【NeurIPS 2021教程】UFC-César Lincoln C教授：<高斯过程>来龙去脉，216页ppt

专知会员服务

22+阅读 · 2021年12月9日

最新《高斯过程回归简明教程》，19页pdf

最新《高斯过程回归简明教程》，19页pdf

专知会员服务

73+阅读 · 2020年9月30日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

【ICML2020投稿论文-DeepMind】时序差分学习的推理与泛化，Temporal Difference Learning

专知会员服务

26+阅读 · 2020年3月16日

【东京大学】图采样，Sampling on Graphs: From Theory to Applications

【东京大学】图采样，Sampling on Graphs: From Theory to Applications

专知会员服务

19+阅读 · 2020年3月10日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

【电子书推荐】机器学习中的高斯过程Gaussian Processes for Machine Learning，剑桥大学 | Carl Edward Rasmussen，爱丁堡大学 | Chris Williams

专知会员服务

98+阅读 · 2019年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能赋能无人机：俄乌战争（万字长文）

美军条令《海军陆战队规划流程（2026版）》

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

国外海军作战管理系统与作战训练系统

相关资讯

【干货书】贝叶斯推断随机过程，449页pdf

【干货书】贝叶斯推断随机过程，449页pdf

专知

31+阅读 · 2020年8月27日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

【论文】Awesome Relation Classification Paper（关系分类）（PART II）

AINLP

15+阅读 · 2019年8月12日

解读 | 得见的高斯过程

解读 | 得见的高斯过程

机器学习算法与Python学习

14+阅读 · 2019年2月13日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

【论文推荐】最新八篇主题模型相关论文—主题建模优化、变分推断、情绪强度、神经语言模型、搜索、社区聚合、主题建模的问题、光谱学习

【论文推荐】最新八篇主题模型相关论文—主题建模优化、变分推断、情绪强度、神经语言模型、搜索、社区聚合、主题建模的问题、光谱学习

专知

13+阅读 · 2018年3月8日

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

极市平台

16+阅读 · 2018年1月20日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

相关论文

Wasserstein-type Gaussian Process Regressions for Input Measurement Uncertainty

Wasserstein-type Gaussian Process Regressions for Input Measurement Uncertainty

Arxiv

0+阅读 · 3月18日

Adaptive Prior Selection in Gaussian Process Bandits with Thompson Sampling

Arxiv

0+阅读 · 3月12日

Vecchia Gaussian Processes: on probabilistic and statistical properties

Arxiv

0+阅读 · 3月11日

Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling

Arxiv

0+阅读 · 3月11日

Sparse Variational Student-t Processes for Heavy-tailed Modeling

Arxiv

0+阅读 · 3月10日

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Arxiv

0+阅读 · 3月10日

Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces

Arxiv

0+阅读 · 3月9日

Empirical Gaussian Processes

Arxiv

0+阅读 · 2月12日

Thompson Sampling-Based Learning and Control for Unknown Dynamic Systems

Arxiv

0+阅读 · 2月5日

Thompson Sampling via Fine-Tuning of LLMs

Arxiv

0+阅读 · 1月30日

相关基金

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

14+阅读 · 2015年12月31日

高阶微分方程的周期解及多重性

国家自然科学基金

0+阅读 · 2015年12月31日

两类分数阶发展方程解的适定性及吸引子

国家自然科学基金

0+阅读 · 2015年12月31日

基于贝叶斯观点的分数阶扩散方程反问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

非高斯噪声中基于分数低阶统计量的频谱感知技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

高斯序列与过程的极值理论

国家自然科学基金

2+阅读 · 2015年12月31日

Ornstein-Uhlenbeck 型过程多变点检验及两样本检验问题

国家自然科学基金

1+阅读 · 2015年12月31日

分数阶薛定谔方程的数值方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高阶分数阶偏微分方程的全离散局部间断有限元方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶扩散方程反向问题的正则化理论与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员