Quantum-Enhanced Neural Contextual Bandit Algorithms - 专知论文

会员服务 ·

0

算法 · 赌博机 · 上下文 · 参数化 · 不稳定 ·

Quantum-Enhanced Neural Contextual Bandit Algorithms

翻译：量子增强的神经上下文赌博机算法

Yuqi Huang,Vincent Y. F Tan,Sharu Theresa Jose

from arxiv, 30 pages, under review

Stochastic contextual bandits are fundamental for sequential decision-making but pose significant challenges for existing neural network-based algorithms, particularly when scaling to quantum neural networks (QNNs) due to issues such as massive over-parameterization, computational instability, and the barren plateau phenomenon. This paper introduces the Quantum Neural Tangent Kernel-Upper Confidence Bound (QNTK-UCB) algorithm, a novel algorithm that leverages the Quantum Neural Tangent Kernel (QNTK) to address these limitations. By freezing the QNN at a random initialization and utilizing its static QNTK as a kernel for ridge regression, QNTK-UCB bypasses the unstable training dynamics inherent in explicit parameterized quantum circuit training while fully exploiting the unique quantum inductive bias. For a time horizon $T$ and $K$ actions, our theoretical analysis reveals a significantly improved parameter scaling of $Ω((TK)^3)$ for QNTK-UCB, a substantial reduction compared to $Ω((TK)^8)$ required by classical NeuralUCB algorithms for similar regret guarantees. Empirical evaluations on non-linear synthetic benchmarks and quantum-native variational quantum eigensolver tasks demonstrate QNTK-UCB's superior sample efficiency in low-data regimes. This work highlights how the inherent properties of QNTK provide implicit regularization and a sharper spectral decay, paving the way for achieving ``quantum advantage'' in online learning.

翻译：随机上下文赌博机是序列决策制定的基础，但对现有的基于神经网络的算法提出了重大挑战，尤其是在扩展到量子神经网络（QNNs）时，由于存在大规模过参数化、计算不稳定性和贫瘠高原现象等问题。本文介绍了量子神经正切核-上置信界（QNTK-UCB）算法，这是一种新颖的算法，它利用量子神经正切核（QNTK）来解决这些局限性。通过在随机初始化时冻结QNN，并利用其静态QNTK作为岭回归的核函数，QNTK-UCB绕过了显式参数化量子电路训练中固有的不稳定训练动态，同时充分利用了独特的量子归纳偏置。对于时间范围$T$和$K$个动作，我们的理论分析表明，QNTK-UCB的参数缩放显著改善为$Ω((TK)^3)$，与经典NeuralUCB算法在类似遗憾保证下所需的$Ω((TK)^8)$相比大幅降低。在非线性合成基准测试和量子原生变分量子本征求解器任务上的实证评估表明，QNTK-UCB在低数据区域具有卓越的样本效率。这项工作突显了QNTK的固有特性如何提供隐式正则化和更锐利的谱衰减，为实现在线学习中的“量子优势”铺平了道路。

0

相关内容

在数学和计算机科学之中，算法（Algorithm）为一个计算的具体步骤，常用于计算、数据处理和自动推理。精确而言，算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。来自维基百科：算法

量子增强计算机视觉：超越经典算法

量子增强计算机视觉：超越经典算法

专知会员服务

20+阅读 · 2025年10月9日

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

专知会员服务

89+阅读 · 2023年6月19日

《使用各种数据生成模型评估量子纠错的神经网络解码器性能》美国空军技术学院142页论文

《使用各种数据生成模型评估量子纠错的神经网络解码器性能》美国空军技术学院142页论文

专知会员服务

12+阅读 · 2022年10月10日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知会员服务

56+阅读 · 2022年10月8日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

专知会员服务

30+阅读 · 2022年6月21日

万字综述，GNN在NLP中的应用，建议收藏慢慢看

万字综述，GNN在NLP中的应用，建议收藏慢慢看

专知会员服务

59+阅读 · 2021年6月22日

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

专知会员服务

156+阅读 · 2021年5月9日

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

专知会员服务

34+阅读 · 2020年3月10日

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

专知会员服务

95+阅读 · 2019年11月8日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

系列教程GNN-algorithms之五：《注意力机制在图上的应用—GAT》

系列教程GNN-algorithms之五：《注意力机制在图上的应用—GAT》

专知

14+阅读 · 2020年8月7日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

NAACL 2019最佳论文：量子概率驱动的神经网络

NAACL 2019最佳论文：量子概率驱动的神经网络

PaperWeekly

14+阅读 · 2019年6月10日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

量子算法理论专题讲习班

国家自然科学基金

16+阅读 · 2017年12月31日

基于量子随机行走智能处理的理论和方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于非局域性的量子博弈研究

国家自然科学基金

1+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

量子计算算法设计与实现方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

量子码的构造

国家自然科学基金

1+阅读 · 2015年12月31日

基于张量网络算法研究低维量子系统中的非局域关联和量子相变的标度行为

国家自然科学基金

0+阅读 · 2015年12月31日

多体量子纠缠与量子信息网络研究

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

Variational Quantum Circuit-Based Reinforcement Learning for Dynamic Portfolio Optimization

Arxiv

0+阅读 · 1月28日

Practical insights on the effect of different encodings, ansätze and measurements in quantum and hybrid convolutional neural networks

Arxiv

0+阅读 · 1月26日

Scalable Quantum Message Passing Graph Neural Networks for Next-Generation Wireless Communications: Architectures, Use Cases, and Future Directions

Arxiv

0+阅读 · 1月26日

BanditLP: Large-Scale Stochastic Optimization for Personalized Recommendations

Arxiv

0+阅读 · 1月22日

Efficient Clustering in Stochastic Bandits

Arxiv

0+阅读 · 1月14日

Tractable Multinomial Logit Contextual Bandits with Non-Linear Utilities

Arxiv

0+阅读 · 1月11日

Enhancing Expressivity of Quantum Neural Networks Based on the SWAP test

Arxiv

0+阅读 · 1月8日

Precision Autotuning for Linear Solvers via Contextual Bandit-Based RL

Precision Autotuning for Linear Solvers via Contextual Bandit-Based RL

Arxiv

0+阅读 · 1月2日

Sparse Additive Contextual Bandits: A Nonparametric Approach for Online Decision-Making with High-Dimensional Covariates

Arxiv

0+阅读 · 2025年12月31日

Probabilistic Computers for Neural Quantum States

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

专知会员服务

3+阅读 · 6月1日

综述 | OPSD：大语言模型的在线策略自蒸馏

综述 | OPSD：大语言模型的在线策略自蒸馏

专知会员服务

3+阅读 · 6月1日

算法化战争：人工智能时代的新范式（万字长文）

算法化战争：人工智能时代的新范式（万字长文）

专知会员服务

8+阅读 · 6月1日

帕兰蒂尔Maven：军事人工智能的新纪元

帕兰蒂尔Maven：军事人工智能的新纪元

专知会员服务

8+阅读 · 6月1日

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

专知会员服务

9+阅读 · 6月1日

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

专知会员服务

9+阅读 · 6月1日

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

13+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

6+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

5+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

3+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

9+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

4+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

6+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

7+阅读 · 5月30日

相关VIP内容

量子增强计算机视觉：超越经典算法

量子增强计算机视觉：超越经典算法

专知会员服务

20+阅读 · 2025年10月9日

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

【干货书】算法博弈论，Algorithmic Game Theory，775页pdf

专知会员服务

89+阅读 · 2023年6月19日

《使用各种数据生成模型评估量子纠错的神经网络解码器性能》美国空军技术学院142页论文

《使用各种数据生成模型评估量子纠错的神经网络解码器性能》美国空军技术学院142页论文

专知会员服务

12+阅读 · 2022年10月10日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知会员服务

56+阅读 · 2022年10月8日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

专知会员服务

30+阅读 · 2022年6月21日

万字综述，GNN在NLP中的应用，建议收藏慢慢看

万字综述，GNN在NLP中的应用，建议收藏慢慢看

专知会员服务

59+阅读 · 2021年6月22日

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

【经典书】算法博弈论，775页pdf，Algorithmic Game Theory

专知会员服务

156+阅读 · 2021年5月9日

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

谷歌推出量子机器学习框架TFQ-TensorFlow Quantum，一个可训练量子模型的机器学习框架

专知会员服务

34+阅读 · 2020年3月10日

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

专知会员服务

95+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | OPSD：大语言模型的在线策略自蒸馏

帕兰蒂尔Maven：军事人工智能的新纪元

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

算法化战争：人工智能时代的新范式（万字长文）

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

系列教程GNN-algorithms之五：《注意力机制在图上的应用—GAT》

系列教程GNN-algorithms之五：《注意力机制在图上的应用—GAT》

专知

14+阅读 · 2020年8月7日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

NAACL 2019最佳论文：量子概率驱动的神经网络

NAACL 2019最佳论文：量子概率驱动的神经网络

PaperWeekly

14+阅读 · 2019年6月10日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

相关论文

Variational Quantum Circuit-Based Reinforcement Learning for Dynamic Portfolio Optimization

Arxiv

0+阅读 · 1月28日

Practical insights on the effect of different encodings, ansätze and measurements in quantum and hybrid convolutional neural networks

Arxiv

0+阅读 · 1月26日

Scalable Quantum Message Passing Graph Neural Networks for Next-Generation Wireless Communications: Architectures, Use Cases, and Future Directions

Arxiv

0+阅读 · 1月26日

BanditLP: Large-Scale Stochastic Optimization for Personalized Recommendations

Arxiv

0+阅读 · 1月22日

Efficient Clustering in Stochastic Bandits

Arxiv

0+阅读 · 1月14日

Tractable Multinomial Logit Contextual Bandits with Non-Linear Utilities

Arxiv

0+阅读 · 1月11日

Enhancing Expressivity of Quantum Neural Networks Based on the SWAP test

Arxiv

0+阅读 · 1月8日

Precision Autotuning for Linear Solvers via Contextual Bandit-Based RL

Precision Autotuning for Linear Solvers via Contextual Bandit-Based RL

Arxiv

0+阅读 · 1月2日

Sparse Additive Contextual Bandits: A Nonparametric Approach for Online Decision-Making with High-Dimensional Covariates

Arxiv

0+阅读 · 2025年12月31日

Probabilistic Computers for Neural Quantum States

Arxiv

0+阅读 · 2025年12月31日

相关基金

量子算法理论专题讲习班

国家自然科学基金

16+阅读 · 2017年12月31日

基于量子随机行走智能处理的理论和方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于非局域性的量子博弈研究

国家自然科学基金

1+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

量子计算算法设计与实现方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

量子码的构造

国家自然科学基金

1+阅读 · 2015年12月31日

基于张量网络算法研究低维量子系统中的非局域关联和量子相变的标度行为

国家自然科学基金

0+阅读 · 2015年12月31日

多体量子纠缠与量子信息网络研究

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员