当低阶项占主导时：针对重尾损失的自适应专家算法 (When Lower-Order Terms Dominate: Adaptive Expert Algorithms for Heavy-Tailed Losses) - 专知论文

会员服务 ·

0

损失 · 算法 · 自适应 · 自适应算法 · 损失函数 ·

When Lower-Order Terms Dominate: Adaptive Expert Algorithms for Heavy-Tailed Losses

翻译：当低阶项占主导时：针对重尾损失的自适应专家算法

Antoine Moulin,Emmanuel Esposito,Dirk van der Hoeven

We consider the problem setting of prediction with expert advice with possibly heavy-tailed losses, i.e. the only assumption on the losses is an upper bound on their second moments, denoted by $θ$. We develop adaptive algorithms that do not require any prior knowledge about the range or the second moment of the losses. Existing adaptive algorithms have what is typically considered a lower-order term in their regret guarantees. We show that this lower-order term, which is often the maximum of the losses, can actually dominate the regret bound in our setting. Specifically, we show that even with small constant $θ$, this lower-order term can scale as $\sqrt{KT}$, where $K$ is the number of experts and $T$ is the time horizon. We propose adaptive algorithms with improved regret bounds that avoid the dependence on such a lower-order term and guarantee $\mathcal{O}(\sqrt{θT\log(K)})$ regret in the worst case, and $\mathcal{O}(θ\log(KT)/Δ_{\min})$ regret when the losses are sampled i.i.d. from some fixed distribution, where $Δ_{\min}$ is the difference between the mean losses of the second best expert and the best expert. Additionally, when the loss function is the squared loss, our algorithm also guarantees improved regret bounds over prior results.

翻译：我们考虑在可能具有重尾损失的专家建议预测问题设置下进行研究，即对损失函数的唯一假设是其二阶矩存在上界，记为$θ$。我们开发了自适应算法，这些算法无需任何关于损失范围或二阶矩的先验知识。现有的自适应算法在其遗憾保证中通常包含一个通常被视为低阶项的组成部分。我们证明，在我们的设置中，这个低阶项（通常是损失的最大值）实际上可能主导遗憾界。具体而言，我们证明即使$θ$为较小的常数，该低阶项也可能按$\sqrt{KT}$的尺度增长，其中$K$是专家数量，$T$是时间范围。我们提出了具有改进遗憾界的自适应算法，避免了对这种低阶项的依赖，并在最坏情况下保证$\mathcal{O}(\sqrt{θT\log(K)})$的遗憾，当损失从某个固定分布独立同分布采样时，保证$\mathcal{O}(θ\log(KT)/Δ_{\min})$的遗憾，其中$Δ_{\min}$是次优专家与最优专家平均损失之间的差值。此外，当损失函数为平方损失时，我们的算法相比先前结果也能保证更优的遗憾界。

0

相关内容

《不确定条件下优化问题的高效精确与近似算法》MIT最新130页

《不确定条件下优化问题的高效精确与近似算法》MIT最新130页

专知会员服务

29+阅读 · 2025年11月19日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

27+阅读 · 2024年8月27日

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

专知会员服务

70+阅读 · 2023年1月17日

《通信和导航中的优化算法设计》美国空军研究实验室

《通信和导航中的优化算法设计》美国空军研究实验室

专知会员服务

40+阅读 · 2022年8月19日

机器学习损失函数概述，Loss Functions in Machine Learning

机器学习损失函数概述，Loss Functions in Machine Learning

专知会员服务

84+阅读 · 2022年3月19日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【干货】最新《深度学习优化导论:基于梯度的优化》，252页ppt

【干货】最新《深度学习优化导论:基于梯度的优化》，252页ppt

专知会员服务

63+阅读 · 2020年11月29日

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

专知会员服务

21+阅读 · 2020年4月3日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

专知会员服务

44+阅读 · 2020年3月4日

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

12+阅读 · 2022年7月3日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

从泰勒展开来看梯度下降算法

从泰勒展开来看梯度下降算法

深度学习每日摘要

13+阅读 · 2019年4月9日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

产业智能官

13+阅读 · 2018年8月18日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

绝对干货 | 随机梯度下降算法综述

绝对干货 | 随机梯度下降算法综述

菜鸟的机器学习

15+阅读 · 2017年10月30日

低秩张量补全问题的算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

线性互补约束二次规划问题的一个全局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义低秩矩阵重构算法及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向不同对称性分子的自适应高性能单颗粒重构算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自适应交叉近似的低秩分解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高阶张量的低秩恢复问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

一种全新的结构修改重分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

Steklov特征值问题的自适应非协调有限元方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

相依重尾随机变量和的渐近性及其在更新风险模型中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

关于二阶锥互补约束数学规划问题的约束规范和算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Tight Long-Term Tail Decay of (Clipped) SGD in Non-Convex Optimization

Arxiv

0+阅读 · 2月5日

A Single-Loop First-Order Algorithm for Linearly Constrained Bilevel Optimization

Arxiv

0+阅读 · 2月4日

Optimal Asynchronous Stochastic Nonconvex Optimization under Heavy-Tailed Noise

Arxiv

0+阅读 · 1月27日

Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards

Arxiv

0+阅读 · 1月27日

Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards

Arxiv

0+阅读 · 1月25日

Robust low-rank estimation with multiple binary responses using pairwise AUC loss

Arxiv

0+阅读 · 1月13日

Cauchy-Gaussian Overbound for Heavy-tailed GNSS Measurement Errors

Arxiv

0+阅读 · 1月12日

Minimax Optimal Robust Sparse Regression with Heavy-Tailed Designs: A Gradient-Based Approach

Arxiv

0+阅读 · 1月9日

Avoiding the Price of Adaptivity: Inference in Linear Contextual Bandits via Stability

Arxiv

0+阅读 · 1月8日

A Method For Bounding Tail Probabilities

Arxiv

0+阅读 · 1月5日

VIP会员

文章信息

相关主题

自适应算法

相关VIP内容

《不确定条件下优化问题的高效精确与近似算法》MIT最新130页

《不确定条件下优化问题的高效精确与近似算法》MIT最新130页

专知会员服务

29+阅读 · 2025年11月19日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

27+阅读 · 2024年8月27日

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

如何用机器学习损失函数？最新《机器学习损失函数》综述，详述其33个损失函数与分类法

专知会员服务

70+阅读 · 2023年1月17日

《通信和导航中的优化算法设计》美国空军研究实验室

《通信和导航中的优化算法设计》美国空军研究实验室

专知会员服务

40+阅读 · 2022年8月19日

机器学习损失函数概述，Loss Functions in Machine Learning

机器学习损失函数概述，Loss Functions in Machine Learning

专知会员服务

84+阅读 · 2022年3月19日

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

新加坡国立大学最新「大规模深度学习优化」综述论文，带你全面了解最新深度学习准确率和效率的优化方法

专知会员服务

54+阅读 · 2021年11月19日

【干货】最新《深度学习优化导论:基于梯度的优化》，252页ppt

【干货】最新《深度学习优化导论:基于梯度的优化》，252页ppt

专知会员服务

63+阅读 · 2020年11月29日

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

专知会员服务

21+阅读 · 2020年4月3日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

专知会员服务

44+阅读 · 2020年3月4日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

12+阅读 · 2022年7月3日

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

【学界】CVPR 2019 | 旷视研究院提出新型损失函数：改善边界框模糊问题

GAN生成式对抗网络

14+阅读 · 2019年5月20日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

从泰勒展开来看梯度下降算法

从泰勒展开来看梯度下降算法

深度学习每日摘要

13+阅读 · 2019年4月9日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

【人工智能】神经网络常用优化算法概览、一文了解迁移学习经典算法

产业智能官

13+阅读 · 2018年8月18日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

绝对干货 | 随机梯度下降算法综述

绝对干货 | 随机梯度下降算法综述

菜鸟的机器学习

15+阅读 · 2017年10月30日

相关论文

Tight Long-Term Tail Decay of (Clipped) SGD in Non-Convex Optimization

Arxiv

0+阅读 · 2月5日

A Single-Loop First-Order Algorithm for Linearly Constrained Bilevel Optimization

Arxiv

0+阅读 · 2月4日

Optimal Asynchronous Stochastic Nonconvex Optimization under Heavy-Tailed Noise

Arxiv

0+阅读 · 1月27日

Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards

Arxiv

0+阅读 · 1月27日

Improved Regret Bounds for Linear Bandits with Heavy-Tailed Rewards

Arxiv

0+阅读 · 1月25日

Robust low-rank estimation with multiple binary responses using pairwise AUC loss

Arxiv

0+阅读 · 1月13日

Cauchy-Gaussian Overbound for Heavy-tailed GNSS Measurement Errors

Arxiv

0+阅读 · 1月12日

Minimax Optimal Robust Sparse Regression with Heavy-Tailed Designs: A Gradient-Based Approach

Arxiv

0+阅读 · 1月9日

Avoiding the Price of Adaptivity: Inference in Linear Contextual Bandits via Stability

Arxiv

0+阅读 · 1月8日

A Method For Bounding Tail Probabilities

Arxiv

0+阅读 · 1月5日

相关基金

低秩张量补全问题的算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

线性互补约束二次规划问题的一个全局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

广义低秩矩阵重构算法及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向不同对称性分子的自适应高性能单颗粒重构算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自适应交叉近似的低秩分解算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高阶张量的低秩恢复问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

一种全新的结构修改重分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

Steklov特征值问题的自适应非协调有限元方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

相依重尾随机变量和的渐近性及其在更新风险模型中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

关于二阶锥互补约束数学规划问题的约束规范和算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员