Revisiting Matrix Sketching in Linear Bandits: Achieving Sublinear Regret via Dyadic Block Sketching - 专知论文

会员服务 ·

0

赌博机 · 算法 · 计算效率 · 在线 · 高维 ·

Revisiting Matrix Sketching in Linear Bandits: Achieving Sublinear Regret via Dyadic Block Sketching

翻译：重访线性赌博机中的矩阵素描：通过二元块素描实现次线性遗憾

Dongxie Wen,Hanyan Yin,Xiao Zhang,Peng Zhao,Lijun Zhang,Zhewei Wei

from arxiv, Accepted by ICLR 2026

Linear bandits have become a cornerstone of online learning and sequential decision-making, providing solid theoretical foundations for balancing exploration and exploitation. Within this domain, matrix sketching serves as a critical component for achieving computational efficiency, especially when confronting high-dimensional problem instances. The sketch-based approaches reduce per-round complexity from $Ω(d^2)$ to $O(dl)$, where $d$ is the dimension and $l<d$ is the sketch size. However, this computational efficiency comes with a fundamental pitfall: when the streaming matrix exhibits heavy spectral tails, such algorithms can incur vacuous \textit{linear regret}. In this paper, we revisit the regret bounds and algorithmic design for sketch-based linear bandits. Our analysis reveals that inappropriate sketch sizes can lead to substantial spectral error, severely undermining regret guarantees. To overcome this issue, we propose Dyadic Block Sketching, a novel multi-scale matrix sketching approach that dynamically adjusts the sketch size during the learning process. We apply this technique to linear bandits and demonstrate that the new algorithm achieves \textit{sublinear regret} bounds without requiring prior knowledge of the streaming matrix properties. It establishes a general framework for efficient sketch-based linear bandits, which can be integrated with any matrix sketching method that provides covariance guarantees. Comprehensive experimental evaluation demonstrates the superior utility-efficiency trade-off achieved by our approach.

翻译：线性赌博机已成为在线学习和序贯决策的基石，为探索与利用的平衡提供了坚实的理论基础。在该领域中，矩阵素描是实现计算效率的关键组成部分，尤其是在面对高维问题实例时。基于素描的方法将每轮复杂度从 $Ω(d^2)$ 降低至 $O(dl)$，其中 $d$ 为维度，$l<d$ 为素描尺寸。然而，这种计算效率伴随着一个根本性缺陷：当流矩阵呈现厚重的谱尾时，此类算法可能招致空洞的\textit{线性遗憾}。本文重新审视了基于素描的线性赌博机的遗憾界与算法设计。我们的分析表明，不恰当的素描尺寸会导致显著的谱误差，从而严重削弱遗憾保证。为克服此问题，我们提出了二元块素描，一种新颖的多尺度矩阵素描方法，可在学习过程中动态调整素描尺寸。我们将此技术应用于线性赌博机，并证明新算法实现了\textit{次线性遗憾}界，且无需预先知晓流矩阵的特性。这为高效的基于素描的线性赌博机建立了一个通用框架，该框架可与任何提供协方差保证的矩阵素描方法集成。全面的实验评估表明，我们的方法实现了优越的效用-效率权衡。

0

相关内容

赌博机

【ICML2025】免费的Fisher？通过回收平方梯度累加器近似Fisher信息矩阵

【ICML2025】免费的Fisher？通过回收平方梯度累加器近似Fisher信息矩阵

专知会员服务

13+阅读 · 2025年7月28日

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

专知会员服务

34+阅读 · 2024年10月17日

【博士论文】最优传输的进展：低秩结构及其在机器学习中的应用，364页pdf

【博士论文】最优传输的进展：低秩结构及其在机器学习中的应用，364页pdf

专知会员服务

49+阅读 · 2023年10月26日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

图文理解矩阵与线代！《矩阵世界与线性代数艺术》可视化手册，14页pdf，Kenji Hiranabe编著，Lecun点赞！

图文理解矩阵与线代！《矩阵世界与线性代数艺术》可视化手册，14页pdf，Kenji Hiranabe编著，Lecun点赞！

专知会员服务

151+阅读 · 2022年8月11日

【干货书】面向数据科学的高级线性模型

专知会员服务

54+阅读 · 2021年10月1日

2840页博士论文！《矩阵理论:优化、集中和算法》，德州大学奥斯汀Zhao Song

2840页博士论文！《矩阵理论:优化、集中和算法》，德州大学奥斯汀Zhao Song

专知会员服务

49+阅读 · 2021年1月25日

必须收藏！MIT-Gilbert老爷子《矩阵图解》，一张图看透矩阵

必须收藏！MIT-Gilbert老爷子《矩阵图解》，一张图看透矩阵

专知会员服务

112+阅读 · 2020年11月17日

【论文推荐】数据科学中有关矩阵方法的文献综述：A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE

【论文推荐】数据科学中有关矩阵方法的文献综述：A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE

专知会员服务

25+阅读 · 2019年12月19日

【电子书|交互式线性代数】《Interactive Linear Algebra》by Dan Margalit, Joseph Rabinoff（附455页pdf）

【电子书|交互式线性代数】《Interactive Linear Algebra》by Dan Margalit, Joseph Rabinoff（附455页pdf）

专知会员服务

69+阅读 · 2019年11月30日

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图与推荐

10+阅读 · 2020年3月28日

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

专知

37+阅读 · 2019年11月30日

一文看懂线性回归（3个优缺点+8种方法评测）

一文看懂线性回归（3个优缺点+8种方法评测）

AINLP

19+阅读 · 2019年10月16日

一文读懂线性回归、岭回归和Lasso回归

一文读懂线性回归、岭回归和Lasso回归

CSDN

34+阅读 · 2019年10月13日

【机器学习】一文读懂线性回归、岭回归和Lasso回归

【机器学习】一文读懂线性回归、岭回归和Lasso回归

AINLP

20+阅读 · 2019年10月12日

那些值得推荐和收藏的线性代数学习资源

那些值得推荐和收藏的线性代数学习资源

AINLP

25+阅读 · 2019年3月6日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

【干货】深度学习中的线性代数

【干货】深度学习中的线性代数

专知

21+阅读 · 2018年3月30日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

机器之心最干的文章：机器学习中的矩阵、向量求导

机器之心最干的文章：机器学习中的矩阵、向量求导

深度学习世界

12+阅读 · 2018年2月7日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

大型稀疏奇异复对称线性系统的高效迭代法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于约束等距条件的噪音低秩矩阵恢复算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

结构矩阵线性互补问题的模系矩阵分裂迭代方法

国家自然科学基金

0+阅读 · 2015年12月31日

图像修补中结构矩阵的预处理方法与理论

国家自然科学基金

1+阅读 · 2015年12月31日

基于马尔科夫链的线性系统求解问题的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

超分辨率中的矩阵值算子学习问题

国家自然科学基金

1+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

Learning, Misspecification, and Cognitive Arbitrage in Linear-Quadratic Network Games

Learning, Misspecification, and Cognitive Arbitrage in Linear-Quadratic Network Games

Arxiv

0+阅读 · 3月17日

Nonlinear Information Theory: Characterizing Distributional Uncertainty in Communication Models with Sublinear Expectation

Arxiv

0+阅读 · 3月17日

Robust and Computationally Efficient Linear Contextual Bandits under Adversarial Corruption and Heavy-Tailed Noise

Robust and Computationally Efficient Linear Contextual Bandits under Adversarial Corruption and Heavy-Tailed Noise

Arxiv

0+阅读 · 3月16日

Sampling as Bandits: Evaluation-Efficient Design for Black-Box Densities

Arxiv

0+阅读 · 3月14日

Rigidity in LLM Bandits with Implications for Human-AI Dyads

Arxiv

0+阅读 · 3月8日

Inverse Contextual Bandits without Rewards: Learning from a Non-Stationary Learner via Suffix Imitation

Arxiv

0+阅读 · 3月4日

Linear Layouts: Robust Code Generation of Efficient Tensor Computation Using $\mathbb{F}_2$

Arxiv

0+阅读 · 2月27日

Singular Arrange and Traverse Algorithm for Computing Reeb Spaces of Bivariate PL Maps

Arxiv

0+阅读 · 2月25日

Self-Configurable Mesh-Networks for Scalable Distributed Submodular Bandit Optimization

Arxiv

0+阅读 · 2月22日

The Complexity of Sparse Win-Lose Bimatrix Games

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

《防空协同制导：用于中段目标分配的多目标成本函数》

《防空协同制导：用于中段目标分配的多目标成本函数》

专知会员服务

0+阅读 · 12分钟前

《人工智能与海军作战》最新报告

《人工智能与海军作战》最新报告

专知会员服务

0+阅读 · 47分钟前

人工智能专题：中国人工智能系列白皮书-具身智能(2026)，100页pdf

人工智能专题：中国人工智能系列白皮书-具身智能(2026)，100页pdf

专知会员服务

1+阅读 · 今天13:17

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

专知会员服务

1+阅读 · 今天13:07

具身智能安全综述：风险、攻击与防御的多层分类框架

具身智能安全综述：风险、攻击与防御的多层分类框架

专知会员服务

2+阅读 · 今天13:04

【ICML 2026】GLANCE：用视觉-语言好奇心驱动VLM智能体主动探索

【ICML 2026】GLANCE：用视觉-语言好奇心驱动VLM智能体主动探索

专知会员服务

2+阅读 · 今天12:09

具身AI安全综述：风险、攻击与防御

具身AI安全综述：风险、攻击与防御

专知会员服务

2+阅读 · 今天12:02

DeepSeek 版Claude Code，免费小白安装教程来了！

DeepSeek 版Claude Code，免费小白安装教程来了！

专知会员服务

13+阅读 · 5月5日

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

专知会员服务

6+阅读 · 5月5日

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

专知会员服务

8+阅读 · 5月5日

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

专知会员服务

8+阅读 · 5月5日

《火炮弹药快速效能建模：提升互操作性与技术优势》（报告）

《火炮弹药快速效能建模：提升互操作性与技术优势》（报告）

专知会员服务

11+阅读 · 5月5日

《美空军条令出版物 2-0：情报（2026版）》

《美空军条令出版物 2-0：情报（2026版）》

专知会员服务

16+阅读 · 5月5日

美陆军“飞蝇陷阱5.0”项目将新兴技术交到作战人员手中

美陆军“飞蝇陷阱5.0”项目将新兴技术交到作战人员手中

专知会员服务

7+阅读 · 5月5日

帕兰提尔 Gotham：一个游戏规则改变器

帕兰提尔 Gotham：一个游戏规则改变器

专知会员服务

9+阅读 · 5月5日

相关VIP内容

【ICML2025】免费的Fisher？通过回收平方梯度累加器近似Fisher信息矩阵

【ICML2025】免费的Fisher？通过回收平方梯度累加器近似Fisher信息矩阵

专知会员服务

13+阅读 · 2025年7月28日

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

专知会员服务

34+阅读 · 2024年10月17日

【博士论文】最优传输的进展：低秩结构及其在机器学习中的应用，364页pdf

【博士论文】最优传输的进展：低秩结构及其在机器学习中的应用，364页pdf

专知会员服务

49+阅读 · 2023年10月26日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

图文理解矩阵与线代！《矩阵世界与线性代数艺术》可视化手册，14页pdf，Kenji Hiranabe编著，Lecun点赞！

图文理解矩阵与线代！《矩阵世界与线性代数艺术》可视化手册，14页pdf，Kenji Hiranabe编著，Lecun点赞！

专知会员服务

151+阅读 · 2022年8月11日

【干货书】面向数据科学的高级线性模型

专知会员服务

54+阅读 · 2021年10月1日

2840页博士论文！《矩阵理论:优化、集中和算法》，德州大学奥斯汀Zhao Song

2840页博士论文！《矩阵理论:优化、集中和算法》，德州大学奥斯汀Zhao Song

专知会员服务

49+阅读 · 2021年1月25日

必须收藏！MIT-Gilbert老爷子《矩阵图解》，一张图看透矩阵

必须收藏！MIT-Gilbert老爷子《矩阵图解》，一张图看透矩阵

专知会员服务

112+阅读 · 2020年11月17日

【论文推荐】数据科学中有关矩阵方法的文献综述：A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE

【论文推荐】数据科学中有关矩阵方法的文献综述：A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE

专知会员服务

25+阅读 · 2019年12月19日

【电子书|交互式线性代数】《Interactive Linear Algebra》by Dan Margalit, Joseph Rabinoff（附455页pdf）

【电子书|交互式线性代数】《Interactive Linear Algebra》by Dan Margalit, Joseph Rabinoff（附455页pdf）

专知会员服务

69+阅读 · 2019年11月30日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能专题：中国人工智能系列白皮书-具身智能(2026)，100页pdf

具身智能安全综述：风险、攻击与防御的多层分类框架

《人工智能与海军作战》最新报告

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

相关资讯

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图与推荐

10+阅读 · 2020年3月28日

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

专知

37+阅读 · 2019年11月30日

一文看懂线性回归（3个优缺点+8种方法评测）

一文看懂线性回归（3个优缺点+8种方法评测）

AINLP

19+阅读 · 2019年10月16日

一文读懂线性回归、岭回归和Lasso回归

一文读懂线性回归、岭回归和Lasso回归

CSDN

34+阅读 · 2019年10月13日

【机器学习】一文读懂线性回归、岭回归和Lasso回归

【机器学习】一文读懂线性回归、岭回归和Lasso回归

AINLP

20+阅读 · 2019年10月12日

那些值得推荐和收藏的线性代数学习资源

那些值得推荐和收藏的线性代数学习资源

AINLP

25+阅读 · 2019年3月6日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

【干货】深度学习中的线性代数

【干货】深度学习中的线性代数

专知

21+阅读 · 2018年3月30日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

机器之心最干的文章：机器学习中的矩阵、向量求导

机器之心最干的文章：机器学习中的矩阵、向量求导

深度学习世界

12+阅读 · 2018年2月7日

相关论文

Learning, Misspecification, and Cognitive Arbitrage in Linear-Quadratic Network Games

Learning, Misspecification, and Cognitive Arbitrage in Linear-Quadratic Network Games

Arxiv

0+阅读 · 3月17日

Nonlinear Information Theory: Characterizing Distributional Uncertainty in Communication Models with Sublinear Expectation

Arxiv

0+阅读 · 3月17日

Robust and Computationally Efficient Linear Contextual Bandits under Adversarial Corruption and Heavy-Tailed Noise

Robust and Computationally Efficient Linear Contextual Bandits under Adversarial Corruption and Heavy-Tailed Noise

Arxiv

0+阅读 · 3月16日

Sampling as Bandits: Evaluation-Efficient Design for Black-Box Densities

Arxiv

0+阅读 · 3月14日

Rigidity in LLM Bandits with Implications for Human-AI Dyads

Arxiv

0+阅读 · 3月8日

Inverse Contextual Bandits without Rewards: Learning from a Non-Stationary Learner via Suffix Imitation

Arxiv

0+阅读 · 3月4日

Linear Layouts: Robust Code Generation of Efficient Tensor Computation Using $\mathbb{F}_2$

Arxiv

0+阅读 · 2月27日

Singular Arrange and Traverse Algorithm for Computing Reeb Spaces of Bivariate PL Maps

Arxiv

0+阅读 · 2月25日

Self-Configurable Mesh-Networks for Scalable Distributed Submodular Bandit Optimization

Arxiv

0+阅读 · 2月22日

The Complexity of Sparse Win-Lose Bimatrix Games

Arxiv

0+阅读 · 2月20日

相关基金

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

大型稀疏奇异复对称线性系统的高效迭代法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于约束等距条件的噪音低秩矩阵恢复算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

结构矩阵线性互补问题的模系矩阵分裂迭代方法

国家自然科学基金

0+阅读 · 2015年12月31日

图像修补中结构矩阵的预处理方法与理论

国家自然科学基金

1+阅读 · 2015年12月31日

基于马尔科夫链的线性系统求解问题的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

超分辨率中的矩阵值算子学习问题

国家自然科学基金

1+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员