In this book, I introduce the basic concepts of Online Learning through the modern view of Online Convex Optimization. Here, online learning refers to the framework of regret minimization under worst-case assumptions. I present first-order and second-order algorithms for online learning with convex losses, in Euclidean and non-Euclidean settings. All the algorithms are clearly presented as instantiation of Online Mirror Descent or Follow-The-Regularized-Leader and their variants. Particular attention is given to the issue of tuning the parameters of the algorithms and learning in unbounded domains, through adaptive and parameter-free online learning algorithms. Non-convex losses are addressed through convex surrogate losses and randomization. The bandit setting is also briefly discussed, touching on the problem of adversarial and stochastic multi-armed bandits. Finally, I also cover advanced topics, including black-box reductions, saddle-point optimization, sequential investment, and non-stationary forms of regret analysis. The book concludes with a selection of applications of online learning to domains far from it, such as generalization theory and concentration inequalities. I tried to maintain an informal, but mathematically serious, tone throughout the book. No prior knowledge of convex analysis is required. Moreover, all the included proofs have been carefully chosen to be as simple and as short as possible. This also means that sometimes I have added one or two additional assumptions, just to simplify the proofs.


翻译:本书通过现代视角下的在线凸优化,介绍了在线学习的基本概念。在此,在线学习指的是在最坏情况假设下最小化遗憾的框架。我介绍了针对凸损失函数、欧几里得空间与非欧几里得空间中的一阶与二阶在线学习算法。所有算法均清晰地呈现为在线镜像下降法或跟随正则化领导者法及其变体的具体实例。通过自适应和无参数在线学习算法,特别关注了算法参数的调整以及无界域中的学习问题。非凸损失函数通过凸替代损失函数和随机化来处理。简要讨论了赌博机场景,涉及对抗性与随机性多臂赌博机问题。最后,我还涵盖了高级主题,包括黑盒归约、鞍点优化、序列投资以及非平稳形式的遗憾分析。本书以在线学习在泛化理论、浓度不等式等远距离领域的应用实例作为结尾。我力求在全书中保持非正式但数学严谨的风格。读者无需预先了解凸分析知识。此外,所有包含的证明都经过精心挑选,力求尽可能简洁与简短。这意味着有时我会额外添加一两个假设,仅是为了简化证明过程。

0
下载
关闭预览

相关内容

【普林斯顿博士论文】在线学习:优化、控制与学习理论
专知会员服务
31+阅读 · 2025年10月19日
225页《在线学习简明介绍》书册
专知会员服务
17+阅读 · 2025年5月3日
专知会员服务
83+阅读 · 2021年7月31日
专知会员服务
168+阅读 · 2020年7月27日
网络表示学习概述
机器学习与推荐算法
20+阅读 · 2020年3月27日
<好书推荐> -《Pro Deep Learning with TensorFlow》分享
深度学习与NLP
12+阅读 · 2018年9月13日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年6月30日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
Arxiv
0+阅读 · 4月24日
Arxiv
0+阅读 · 4月2日
A Modern Introduction to Online Learning
Arxiv
21+阅读 · 2019年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
1+阅读 · 今天15:00
21世纪的无人机战争
专知会员服务
2+阅读 · 今天14:05
《量子技术的军事任务技术适配与利用》
专知会员服务
2+阅读 · 今天13:51
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
【普林斯顿博士论文】在线学习:优化、控制与学习理论
专知会员服务
31+阅读 · 2025年10月19日
225页《在线学习简明介绍》书册
专知会员服务
17+阅读 · 2025年5月3日
专知会员服务
83+阅读 · 2021年7月31日
专知会员服务
168+阅读 · 2020年7月27日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年6月30日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员