Online Convex Optimization with Heavy Tails: Old Algorithms, New Regrets, and Applications - 专知论文

会员服务 ·

0

梯度 · 算法 · 在线 · 在线凸优化 · 新型 ·

2025 年 12 月 30 日

Online Convex Optimization with Heavy Tails: Old Algorithms, New Regrets, and Applications

翻译：具有重尾特性的在线凸优化：经典算法、新型遗憾界与应用

from arxiv, A short, self-contained version has been accepted at ALT 2026

In Online Convex Optimization (OCO), when the stochastic gradient has a finite variance, many algorithms provably work and guarantee a sublinear regret. However, limited results are known if the gradient estimate has a heavy tail, i.e., the stochastic gradient only admits a finite $\mathsf{p}$-th central moment for some $\mathsf{p}\in\left(1,2\right]$. Motivated by it, this work examines different old algorithms for OCO (e.g., Online Gradient Descent) in the more challenging heavy-tailed setting. Under the standard bounded domain assumption, we establish new regrets for these classical methods without any algorithmic modification. Remarkably, these regret bounds are fully optimal in all parameters (can be achieved even without knowing $\mathsf{p}$), suggesting that OCO with heavy tails can be solved effectively without any extra operation (e.g., gradient clipping). Our new results have several applications. A particularly interesting one is the first provable and optimal convergence result for nonsmooth nonconvex optimization under heavy-tailed noise without gradient clipping. Furthermore, we explore broader settings (e.g., smooth OCO) and extend our ideas to optimistic algorithms to handle different cases simultaneously.

翻译：在在线凸优化（OCO）中，当随机梯度具有有限方差时，许多算法已被证明有效并能保证次线性遗憾。然而，若梯度估计具有重尾特性，即随机梯度仅对某个 $\mathsf{p}\in\left(1,2\right]$ 具有有限 $\mathsf{p}$ 阶中心矩，目前已知的结果有限。受此启发，本研究在更具挑战性的重尾设定下，重新审视了多种经典的OCO算法（例如在线梯度下降法）。在标准有界域假设下，我们为这些经典方法建立了无需任何算法修改的新型遗憾界。值得注意的是，这些遗憾界在所有参数上均完全最优（甚至可在未知 $\mathsf{p}$ 的情况下达到），表明重尾条件下的OCO问题无需任何额外操作（例如梯度裁剪）即可有效求解。我们的新结果具有多方面的应用价值，其中一个特别有趣的成果是首次在无需梯度裁剪的情况下，为重尾噪声下的非光滑非凸优化问题提供了可证明且最优的收敛性结果。此外，我们探索了更广泛的设定（例如光滑OCO），并将思路延伸至乐观算法以同时处理不同场景。

0

相关内容

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。

【MIT博士论文】具有非标准结构的凸优化的新理论和算法,141页pdf

【MIT博士论文】具有非标准结构的凸优化的新理论和算法,141页pdf

专知会员服务

20+阅读 · 2023年8月7日

【斯坦福大学博士论文】凸优化和图算法的新基元，404页pdf

【斯坦福大学博士论文】凸优化和图算法的新基元，404页pdf

专知会员服务

63+阅读 · 2022年8月18日

【经典书】凸优化全面介绍，Lectureson Convex Optimization，603页pdf

【经典书】凸优化全面介绍，Lectureson Convex Optimization，603页pdf

专知会员服务

74+阅读 · 2022年6月3日

南大《优化方法（Optimization Methods》课程，推荐！

南大《优化方法（Optimization Methods》课程，推荐！

专知会员服务

80+阅读 · 2022年4月3日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

【2021新书稿】在线凸优化导论(第二版)，260页pdf

【2021新书稿】在线凸优化导论(第二版)，260页pdf

专知会员服务

74+阅读 · 2021年12月23日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【经典书】凸优化：算法与复杂度，130页pdf

【经典书】凸优化：算法与复杂度，130页pdf

专知会员服务

81+阅读 · 2021年11月16日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知

12+阅读 · 2022年9月16日

机器学习必读新书-《凸优化算法原理详解》，334页pdf

机器学习必读新书-《凸优化算法原理详解》，334页pdf

专知

10+阅读 · 2022年1月4日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

博客 | 机器学习中的数学基础（凸优化）

博客 | 机器学习中的数学基础（凸优化）

AI研习社

14+阅读 · 2018年12月16日

2018年深度学习优化算法最新综述

2018年深度学习优化算法最新综述

计算机视觉战队

10+阅读 · 2018年12月11日

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

产业智能官

13+阅读 · 2018年8月18日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

从浅层模型到深度模型：概览机器学习优化算法

从浅层模型到深度模型：概览机器学习优化算法

机器之心

27+阅读 · 2017年7月9日

非凸稀疏优化的恢复条件与低复杂度算法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

非光滑非凸优化问题的交替线性化算法及其应用

国家自然科学基金

6+阅读 · 2015年12月31日

无限闭凸集族凸可行性问题中投影算法的线性收敛

国家自然科学基金

0+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

非凸二次约束优化问题的全局算法研究及其在信号处理中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

一种全新的结构修改重分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

相依重尾随机变量和的渐近性及其在更新风险模型中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Stability and Generalization of Nonconvex Optimization with Heavy-Tailed Noise

Arxiv

0+阅读 · 1月27日

Optimal Asynchronous Stochastic Nonconvex Optimization under Heavy-Tailed Noise

Arxiv

0+阅读 · 1月27日

Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards

Arxiv

0+阅读 · 1月27日

Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards

Arxiv

0+阅读 · 1月25日

Small Gradient Norm Regret for Online Convex Optimization

Arxiv

0+阅读 · 1月20日

Optimization Insights into Deep Diagonal Linear Networks

Arxiv

0+阅读 · 1月19日

Near-Optimal Decentralized Stochastic Nonconvex Optimization with Heavy-Tailed Noise

Arxiv

0+阅读 · 1月16日

Decentralized Online Convex Optimization with Unknown Feedback Delays

Arxiv

0+阅读 · 1月12日

Distributed Online Convex Optimization with Efficient Communication: Improved Algorithm and Lower bounds

Arxiv

0+阅读 · 1月8日

Universal Dynamic Regret and Constraint Violation Bounds for Constrained Online Convex Optimization

Arxiv

0+阅读 · 1月6日

VIP会员

文章信息

相关主题

在线凸优化

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

3+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

3+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

14+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

7+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

8+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

8+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

11+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

6+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

6+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

8+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

6+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

10+阅读 · 5月29日

相关VIP内容

【MIT博士论文】具有非标准结构的凸优化的新理论和算法,141页pdf

【MIT博士论文】具有非标准结构的凸优化的新理论和算法,141页pdf

专知会员服务

20+阅读 · 2023年8月7日

【斯坦福大学博士论文】凸优化和图算法的新基元，404页pdf

【斯坦福大学博士论文】凸优化和图算法的新基元，404页pdf

专知会员服务

63+阅读 · 2022年8月18日

【经典书】凸优化全面介绍，Lectureson Convex Optimization，603页pdf

【经典书】凸优化全面介绍，Lectureson Convex Optimization，603页pdf

专知会员服务

74+阅读 · 2022年6月3日

南大《优化方法（Optimization Methods》课程，推荐！

南大《优化方法（Optimization Methods》课程，推荐！

专知会员服务

80+阅读 · 2022年4月3日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

【2021新书稿】在线凸优化导论(第二版)，260页pdf

【2021新书稿】在线凸优化导论(第二版)，260页pdf

专知会员服务

74+阅读 · 2021年12月23日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【经典书】凸优化：算法与复杂度，130页pdf

【经典书】凸优化：算法与复杂度，130页pdf

专知会员服务

81+阅读 · 2021年11月16日

【博士论文】机器学习中部分非凸和随机优化算法研究

专知会员服务

75+阅读 · 2020年12月7日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知

12+阅读 · 2022年9月16日

机器学习必读新书-《凸优化算法原理详解》，334页pdf

机器学习必读新书-《凸优化算法原理详解》，334页pdf

专知

10+阅读 · 2022年1月4日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

机器学习中的最优化算法总结

机器学习中的最优化算法总结

人工智能前沿讲习班

22+阅读 · 2019年3月22日

博客 | 机器学习中的数学基础（凸优化）

博客 | 机器学习中的数学基础（凸优化）

AI研习社

14+阅读 · 2018年12月16日

2018年深度学习优化算法最新综述

2018年深度学习优化算法最新综述

计算机视觉战队

10+阅读 · 2018年12月11日

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

产业智能官

13+阅读 · 2018年8月18日

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

2017年深度学习优化算法最新进展：如何改进SGD和Adam方法？

量子位

10+阅读 · 2017年12月10日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

从浅层模型到深度模型：概览机器学习优化算法

从浅层模型到深度模型：概览机器学习优化算法

机器之心

27+阅读 · 2017年7月9日

相关论文

Stability and Generalization of Nonconvex Optimization with Heavy-Tailed Noise

Arxiv

0+阅读 · 1月27日

Optimal Asynchronous Stochastic Nonconvex Optimization under Heavy-Tailed Noise

Arxiv

0+阅读 · 1月27日

Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards

Arxiv

0+阅读 · 1月27日

Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards

Arxiv

0+阅读 · 1月25日

Small Gradient Norm Regret for Online Convex Optimization

Arxiv

0+阅读 · 1月20日

Optimization Insights into Deep Diagonal Linear Networks

Arxiv

0+阅读 · 1月19日

Near-Optimal Decentralized Stochastic Nonconvex Optimization with Heavy-Tailed Noise

Arxiv

0+阅读 · 1月16日

Decentralized Online Convex Optimization with Unknown Feedback Delays

Arxiv

0+阅读 · 1月12日

Distributed Online Convex Optimization with Efficient Communication: Improved Algorithm and Lower bounds

Arxiv

0+阅读 · 1月8日

Universal Dynamic Regret and Constraint Violation Bounds for Constrained Online Convex Optimization

Arxiv

0+阅读 · 1月6日

相关基金

非凸稀疏优化的恢复条件与低复杂度算法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

非光滑非凸优化问题的交替线性化算法及其应用

国家自然科学基金

6+阅读 · 2015年12月31日

无限闭凸集族凸可行性问题中投影算法的线性收敛

国家自然科学基金

0+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

非凸二次约束优化问题的全局算法研究及其在信号处理中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

一种全新的结构修改重分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

相依重尾随机变量和的渐近性及其在更新风险模型中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员