Mixture of linear regression is well studied in statistics and machine learning, where the data points are generated probabilistically using $k$ linear models. Algorithms like Expectation Maximization (EM) may be used to recover the ground truth regressors for this problem. Recently, in \cite{pal2022learning,ghosh_agnostic} the mixed linear regression problem is studied in the agnostic setting, where no generative model on data is assumed. Rather, given a set of data points, the objective is \emph{fit} $k$ lines by minimizing a suitable loss function. It is shown that a modification of EM, namely gradient EM converges exponentially to appropriately defined loss minimizer even in the agnostic setting. In this paper, we study the problem of \emph{fitting} $k$ parametric functions to given set of data points. We adhere to the agnostic setup. However, instead of fitting lines equipped with quadratic loss, we consider any arbitrary parametric function fitting equipped with a strongly convex and smooth loss. This framework encompasses a large class of problems including mixed linear regression (regularized), mixed linear classifiers (mixed logistic regression, mixed Support Vector Machines) and mixed generalized linear regression. We propose and analyze gradient EM for this problem and show that with proper initialization and separation condition, the iterates of gradient EM converge exponentially to appropriately defined population loss minimizers with high probability. This shows the effectiveness of EM type algorithm which converges to \emph{optimal} solution in the non-generative setup beyond mixture of linear regression.


翻译:线性回归混合模型是统计学与机器学习中研究充分的问题,其中数据点通过$k$个线性模型概率生成。期望最大化(EM)等算法可用于恢复该问题的真实回归量。近期,在文献\cite{pal2022learning,ghosh_agnostic}中,混合线性回归问题被置于非生成(agnostic)背景下研究,即不假设数据存在生成模型。相反,给定一组数据点,目标是通过最小化适当的损失函数来\emph{拟合}$k$条直线。研究表明,即使在该非生成背景下,EM的改进版本——梯度EM,也能以指数速度收敛至适当定义的损失极小化器。本文研究对给定数据集进行$k$个参数函数\emph{拟合}的问题。我们沿用非生成框架,但不再局限于采用二次损失拟合直线,而是考虑任意参数函数拟合,并配备强凸且光滑的损失函数。该框架涵盖大量问题,包括(正则化)混合线性回归、混合线性分类器(混合逻辑回归、混合支持向量机)及混合广义线性回归。我们针对该问题提出并分析梯度EM方法,证明在适当初始化与分离条件下,梯度EM的迭代值能够以高概率指数收敛至适当定义的总体损失极小化器。这表明在超出线性回归混合模型的非生成场景中,EM类算法仍能有效收敛至\emph{最优}解。

0
下载
关闭预览

相关内容

【阿姆斯特丹博士论文】带约束学习的优化算法
专知会员服务
20+阅读 · 2025年4月4日
《扩散模型及其应用》最新综述
专知会员服务
50+阅读 · 2024年8月21日
谷歌最新《大语言模型合成数据的最佳实践和经验教训》
可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
132+阅读 · 2020年5月14日
专知会员服务
20+阅读 · 2020年3月29日
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
稀疏性的3个优势 -《稀疏统计学习及其应用》
遇见数学
15+阅读 · 2018年10月24日
谷歌推出新型数据增强算法:AutoAugment
论智
20+阅读 · 2018年6月6日
从最大似然到EM算法:一致的理解方式
PaperWeekly
19+阅读 · 2018年3月19日
干货|EM算法原理总结
全球人工智能
17+阅读 · 2018年1月10日
干货|通俗易懂地解释EM算法并举例说明?
机器学习研究会
12+阅读 · 2017年11月17日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月13日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
【阿姆斯特丹博士论文】带约束学习的优化算法
专知会员服务
20+阅读 · 2025年4月4日
《扩散模型及其应用》最新综述
专知会员服务
50+阅读 · 2024年8月21日
谷歌最新《大语言模型合成数据的最佳实践和经验教训》
可解释强化学习,Explainable Reinforcement Learning: A Survey
专知会员服务
132+阅读 · 2020年5月14日
专知会员服务
20+阅读 · 2020年3月29日
相关资讯
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
稀疏性的3个优势 -《稀疏统计学习及其应用》
遇见数学
15+阅读 · 2018年10月24日
谷歌推出新型数据增强算法:AutoAugment
论智
20+阅读 · 2018年6月6日
从最大似然到EM算法:一致的理解方式
PaperWeekly
19+阅读 · 2018年3月19日
干货|EM算法原理总结
全球人工智能
17+阅读 · 2018年1月10日
干货|通俗易懂地解释EM算法并举例说明?
机器学习研究会
12+阅读 · 2017年11月17日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员