Title: 基于噪声特征的上下文线性赌博机：朝向贝叶斯神谕 Translated abstract: 我们研究了在特征不确定性条件下的上下文线性赌博机问题，其中存在包含缺失项的噪声。为了应对噪声的挑战，我们分析了基于贝叶斯方法的神谕，该方法利用了观测到的噪声特征。我们的贝叶斯分析发现，最优假设可能与基础实现函数相差很远，具体取决于噪声的特征，这是高度非直观的，并且在经典的无噪声设置中并不会出现。这意味着经典方法不能保证非平凡的反悔界。因此，我们提出了一种算法，旨在通过在该模型下观察到的信息实现贝叶斯神谕，并在存在大量臂时实现$\tilde{O}(d\sqrt{T})$反悔界。我们使用合成和真实数据集来演示所提出的算法。 (Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles) - 专知论文

会员服务 ·

0

赌博机/老虎机 · Oracle · 线性的 · 噪声 · INFORMS ·

2023 年 3 月 21 日

Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles

翻译：Title: 基于噪声特征的上下文线性赌博机：朝向贝叶斯神谕 Translated abstract: 我们研究了在特征不确定性条件下的上下文线性赌博机问题，其中存在包含缺失项的噪声。为了应对噪声的挑战，我们分析了基于贝叶斯方法的神谕，该方法利用了观测到的噪声特征。我们的贝叶斯分析发现，最优假设可能与基础实现函数相差很远，具体取决于噪声的特征，这是高度非直观的，并且在经典的无噪声设置中并不会出现。这意味着经典方法不能保证非平凡的反悔界。因此，我们提出了一种算法，旨在通过在该模型下观察到的信息实现贝叶斯神谕，并在存在大量臂时实现$\tilde{O}(d\sqrt{T})$反悔界。我们使用合成和真实数据集来演示所提出的算法。

Jung-hun Kim,Se-Young Yun,Minchan Jeong,Jun Hyun Nam,Jinwoo Shin,Richard Combes

from arxiv, 30 pages; accepted at AISTATS2023; minor corrections to Bayesian features

We study contextual linear bandit problems under feature uncertainty; they are noisy with missing entries. To address the challenges of the noise, we analyze Bayesian oracles given observed noisy features. Our Bayesian analysis finds that the optimal hypothesis can be far from the underlying realizability function, depending on the noise characteristics, which are highly non-intuitive and do not occur for classical noiseless setups. This implies that classical approaches cannot guarantee a non-trivial regret bound. Therefore, we propose an algorithm that aims at the Bayesian oracle from observed information under this model, achieving $\tilde{O}(d\sqrt{T})$ regret bound when there is a large number of arms. We demonstrate the proposed algorithm using synthetic and real-world datasets.

翻译：注：英文中，“linear bandits”和“Bayesian oracles”两个词是固定术语，没有翻译。

0

相关内容

赌博机/老虎机

赌博机/老虎机

【干货书】工程和科学中的概率和统计，

【干货书】工程和科学中的概率和统计，

专知会员服务

58+阅读 · 2022年12月24日

干货书！基于单调算子的大规模凸优化，348页pdf

干货书！基于单调算子的大规模凸优化，348页pdf

专知会员服务

50+阅读 · 2022年7月24日

不可错过！《机器学习100讲》课程，UBC Mark Schmidt讲授

不可错过！《机器学习100讲》课程，UBC Mark Schmidt讲授

专知会员服务

76+阅读 · 2022年6月28日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知会员服务

10+阅读 · 2022年5月28日

WWW21最新「比较学习」教程，135页PPT阐述从排名数据中学习

专知会员服务

37+阅读 · 2021年4月27日

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

专知会员服务

69+阅读 · 2021年3月27日

【经典书】线性代数，436页pdf

专知会员服务

78+阅读 · 2021年3月16日

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

专知会员服务

22+阅读 · 2021年2月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

深度卷积神经网络中的降采样

深度卷积神经网络中的降采样

极市平台

12+阅读 · 2019年5月24日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

利用动态深度学习预测金融时间序列基于Python

利用动态深度学习预测金融时间序列基于Python

量化投资与机器学习

18+阅读 · 2018年10月30日

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

专知

25+阅读 · 2018年4月29日

【论文推荐】最新7篇变分自编码器（VAE）相关论文—汉语诗歌、生成模型、跨模态、MR图像重建、机器翻译、推断、合成人脸

【论文推荐】最新7篇变分自编码器（VAE）相关论文—汉语诗歌、生成模型、跨模态、MR图像重建、机器翻译、推断、合成人脸

专知

11+阅读 · 2018年2月12日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

【推荐】用Tensorflow理解LSTM

【推荐】用Tensorflow理解LSTM

机器学习研究会

36+阅读 · 2017年9月11日

条件模型的计量经济学方法探讨及应用

国家自然科学基金

1+阅读 · 2013年12月31日

自仿集的拓扑结构和李普希兹等价

国家自然科学基金

0+阅读 · 2013年12月31日

高维统计模型中的稳健推断及其应用

国家自然科学基金

1+阅读 · 2012年12月31日

一些q-特殊函数的研究

国家自然科学基金

0+阅读 · 2012年12月31日

非参数变换模型的统计推断

国家自然科学基金

0+阅读 · 2012年12月31日

经验模式分解及其应用于人脸图像光照预处理的几个关键问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

违背分组情形下生存数据的半参数因果推断

国家自然科学基金

1+阅读 · 2012年12月31日

基于混合不确定性量化和高置信度数值模拟的复杂机械系统健康评估

国家自然科学基金

1+阅读 · 2012年12月31日

量子计算下安全的基于格问题的数字签名方案研究

国家自然科学基金

0+阅读 · 2011年12月31日

用多重假设检验方法来研究方差变点问题

国家自然科学基金

0+阅读 · 2009年12月31日

Visual Information Extraction in the Wild: Practical Dataset and End-to-end Solution

Arxiv

0+阅读 · 2023年5月12日

Code-Verification Techniques for the Method-of-Moments Implementation of the Combined-Field Integral Equation

Arxiv

0+阅读 · 2023年5月11日

Learning to Rank under Multinomial Logit Choice

Arxiv

0+阅读 · 2023年5月11日

View Correspondence Network for Implicit Light Field Representation

Arxiv

0+阅读 · 2023年5月10日

Few-shot Link Prediction on N-ary Facts

Arxiv

0+阅读 · 2023年5月10日

Clustered-patch Element Connection for Few-shot Learning

Arxiv

0+阅读 · 2023年5月10日

Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning

Arxiv

34+阅读 · 2022年6月30日

Invariant Information Bottleneck for Domain Generalization

Invariant Information Bottleneck for Domain Generalization

Arxiv

15+阅读 · 2021年12月10日

Adaptive Methods for Real-World Domain Generalization

Arxiv

13+阅读 · 2021年3月29日

Graph Neural Networks with Heterophily

Arxiv

19+阅读 · 2021年2月4日

VIP会员

文章信息

相关主题

赌博机/老虎机

相关VIP内容

【干货书】工程和科学中的概率和统计，

【干货书】工程和科学中的概率和统计，

专知会员服务

58+阅读 · 2022年12月24日

干货书！基于单调算子的大规模凸优化，348页pdf

干货书！基于单调算子的大规模凸优化，348页pdf

专知会员服务

50+阅读 · 2022年7月24日

不可错过！《机器学习100讲》课程，UBC Mark Schmidt讲授

不可错过！《机器学习100讲》课程，UBC Mark Schmidt讲授

专知会员服务

76+阅读 · 2022年6月28日

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

【ICML2022】刻画与克服多模态深度神经网络中的学习贪心特性

专知会员服务

10+阅读 · 2022年5月28日

WWW21最新「比较学习」教程，135页PPT阐述从排名数据中学习

专知会员服务

37+阅读 · 2021年4月27日

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

INRIA最新「机器学习理论」新书，229页pdf原理性阐述机器学习

专知会员服务

69+阅读 · 2021年3月27日

【经典书】线性代数，436页pdf

专知会员服务

78+阅读 · 2021年3月16日

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

【AAAI2021】面向真实世界的鲁棒视觉信息提取:新的数据集和新颖的解决方案

专知会员服务

22+阅读 · 2021年2月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

深度卷积神经网络中的降采样

深度卷积神经网络中的降采样

极市平台

12+阅读 · 2019年5月24日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

利用动态深度学习预测金融时间序列基于Python

利用动态深度学习预测金融时间序列基于Python

量化投资与机器学习

18+阅读 · 2018年10月30日

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

专知

25+阅读 · 2018年4月29日

【论文推荐】最新7篇变分自编码器（VAE）相关论文—汉语诗歌、生成模型、跨模态、MR图像重建、机器翻译、推断、合成人脸

【论文推荐】最新7篇变分自编码器（VAE）相关论文—汉语诗歌、生成模型、跨模态、MR图像重建、机器翻译、推断、合成人脸

专知

11+阅读 · 2018年2月12日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

【推荐】用Tensorflow理解LSTM

【推荐】用Tensorflow理解LSTM

机器学习研究会

36+阅读 · 2017年9月11日

相关论文

Visual Information Extraction in the Wild: Practical Dataset and End-to-end Solution

Arxiv

0+阅读 · 2023年5月12日

Code-Verification Techniques for the Method-of-Moments Implementation of the Combined-Field Integral Equation

Arxiv

0+阅读 · 2023年5月11日

Learning to Rank under Multinomial Logit Choice

Arxiv

0+阅读 · 2023年5月11日

View Correspondence Network for Implicit Light Field Representation

Arxiv

0+阅读 · 2023年5月10日

Few-shot Link Prediction on N-ary Facts

Arxiv

0+阅读 · 2023年5月10日

Clustered-patch Element Connection for Few-shot Learning

Arxiv

0+阅读 · 2023年5月10日

Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning

Arxiv

34+阅读 · 2022年6月30日

Invariant Information Bottleneck for Domain Generalization

Invariant Information Bottleneck for Domain Generalization

Arxiv

15+阅读 · 2021年12月10日

Adaptive Methods for Real-World Domain Generalization

Arxiv

13+阅读 · 2021年3月29日

Graph Neural Networks with Heterophily

Arxiv

19+阅读 · 2021年2月4日

相关基金

条件模型的计量经济学方法探讨及应用

国家自然科学基金

1+阅读 · 2013年12月31日

自仿集的拓扑结构和李普希兹等价

国家自然科学基金

0+阅读 · 2013年12月31日

高维统计模型中的稳健推断及其应用

国家自然科学基金

1+阅读 · 2012年12月31日

一些q-特殊函数的研究

国家自然科学基金

0+阅读 · 2012年12月31日

非参数变换模型的统计推断

国家自然科学基金

0+阅读 · 2012年12月31日

经验模式分解及其应用于人脸图像光照预处理的几个关键问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

违背分组情形下生存数据的半参数因果推断

国家自然科学基金

1+阅读 · 2012年12月31日

基于混合不确定性量化和高置信度数值模拟的复杂机械系统健康评估

国家自然科学基金

1+阅读 · 2012年12月31日

量子计算下安全的基于格问题的数字签名方案研究

国家自然科学基金

0+阅读 · 2011年12月31日

用多重假设检验方法来研究方差变点问题

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员