混合广义线性模型中谱方法的精确渐近分析 (Precise Asymptotics for Spectral Methods in Mixed Generalized Linear Models) - 专知论文

会员服务 ·

0

混合 · 谱方法 · 广义 · 广义线性模型 · 线性模型 ·

Precise Asymptotics for Spectral Methods in Mixed Generalized Linear Models

翻译：混合广义线性模型中谱方法的精确渐近分析

Yihan Zhang,Marco Mondelli,Ramji Venkataramanan

from arxiv, To appear in the SIAM Journal on Mathematics of Data Science

In a mixed generalized linear model, the goal is to learn multiple signals from unlabeled observations: each sample comes from exactly one signal, but it is not known which one. We consider the prototypical problem of estimating two statistically independent signals in a mixed generalized linear model with Gaussian covariates. Spectral methods are a popular class of estimators which output the top two eigenvectors of a suitable data-dependent matrix. However, despite the wide applicability, their design is still obtained via heuristic considerations, and the number of samples $n$ needed to guarantee recovery is super-linear in the signal dimension $d$. In this paper, we develop exact asymptotics on spectral methods in the challenging proportional regime in which $n, d$ grow large and their ratio converges to a finite constant. This allows us optimize the design of the spectral method, and combine it with a simple linear estimator, to minimize the estimation error. Our characterization exploits a mix of tools from random matrices, free probability and the theory of approximate message passing algorithms. Numerical simulations for mixed linear regression and phase retrieval demonstrate the advantage enabled by our analysis over existing designs of spectral methods.

翻译：在混合广义线性模型中，目标是从未标记的观测中学习多个信号：每个样本恰好来自一个信号，但具体属于哪一个信号是未知的。我们考虑在高斯协变量下估计混合广义线性模型中两个统计独立信号的原型问题。谱方法是一类流行的估计器，其输出某个合适的数据依赖矩阵的前两个特征向量。然而，尽管应用广泛，其设计仍基于启发式考量，并且保证恢复所需样本数 $n$ 相对于信号维度 $d$ 是超线性的。本文在具有挑战性的比例区域中，即当 $n$ 和 $d$ 均趋于无穷且其比值收敛于某有限常数时，建立了谱方法的精确渐近性质。这使我们能够优化谱方法的设计，并将其与一个简单的线性估计器相结合，以最小化估计误差。我们的刻画利用了来自随机矩阵、自由概率论以及近似消息传递算法理论的混合工具。针对混合线性回归和相位恢复的数值模拟表明，基于我们分析所实现的设计优于现有的谱方法设计方案。

0

相关内容

《混合专家模型推理优化技术综述》

《混合专家模型推理优化技术综述》

专知会员服务

45+阅读 · 2024年12月21日

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

专知会员服务

44+阅读 · 2023年9月3日

【牛津大学博士论文】随机过程非线性鲁棒独立分量分析，245页pdf

【牛津大学博士论文】随机过程非线性鲁棒独立分量分析，245页pdf

专知会员服务

22+阅读 · 2023年1月8日

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

专知会员服务

87+阅读 · 2022年10月16日

【AI+军事】附论文《处理混合冲突中的不确定性：情报分析中不确定性量化的新方法和模型》

【AI+军事】附论文《处理混合冲突中的不确定性：情报分析中不确定性量化的新方法和模型》

专知会员服务

66+阅读 · 2022年5月2日

【AI+军事】附论文《全社会混合冲突的评估：活动信号与分析家洞察力的融合》

【AI+军事】附论文《全社会混合冲突的评估：活动信号与分析家洞察力的融合》

专知会员服务

31+阅读 · 2022年4月28日

【新书稿】数据科学的谱方法:统计的视角,168页pdf

【新书稿】数据科学的谱方法:统计的视角,168页pdf

专知会员服务

58+阅读 · 2021年10月28日

知识图谱嵌入模型的概率标定,Probability Calibration for Knowledge Graph Embedding Models

专知会员服务

36+阅读 · 2020年5月11日

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

专知会员服务

174+阅读 · 2020年5月1日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

专知

12+阅读 · 2022年4月15日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

详解GAN的谱归一化（Spectral Normalization）

详解GAN的谱归一化（Spectral Normalization）

PaperWeekly

11+阅读 · 2019年2月13日

论文浅尝 | Interaction Embeddings for Prediction and Explanation

论文浅尝 | Interaction Embeddings for Prediction and Explanation

开放知识图谱

11+阅读 · 2019年2月1日

数据分析师应该知道的16种回归技术：偏最小二乘回归

数据分析师应该知道的16种回归技术：偏最小二乘回归

数萃大数据

14+阅读 · 2018年8月29日

综述：深度学习时代的目标检测算法

综述：深度学习时代的目标检测算法

极市平台

27+阅读 · 2018年3月17日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

广义混杂系统的降阶分析与应用

国家自然科学基金

1+阅读 · 2015年12月31日

顾及异方差与空间约束的高光谱混合像元模糊聚类分解方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

高性能谱/谱元方法研究及其在多相复杂流体中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

电磁兼容仿真不确定性定量分析方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

四阶微分方程的谱和谱元方法

国家自然科学基金

0+阅读 · 2014年12月31日

短波认知ALE系统中基于深度学习-GP混合模型的多维谱预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

Hessian Spectral Analysis at Foundation Model Scale

Arxiv

0+阅读 · 1月31日

A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data

Arxiv

0+阅读 · 1月29日

Variational autoencoder for inference of nonlinear mixed effect models based on ordinary differential equations

Arxiv

0+阅读 · 1月24日

Spectral decomposition-assisted multi-study factor analysis

Arxiv

0+阅读 · 1月23日

Finite-Sample Inference for Sparsely Permuted Linear Regression

Arxiv

0+阅读 · 1月22日

Cluster-Based Generalized Additive Models Informed by Random Fourier Features

Arxiv

0+阅读 · 1月21日

On Linear Estimators for some Stable Vectors

Arxiv

0+阅读 · 1月14日

Aligning the Spectrum: Hybrid Graph Pre-training and Prompt Tuning across Homophily and Heterophily

Arxiv

0+阅读 · 1月12日

Gaussian Mixture Model with unknown diagonal covariances via continuous sparse regularization

Arxiv

0+阅读 · 1月8日

Causal Discovery with Mixed Latent Confounding via Precision Decomposition

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

广义线性模型

相关VIP内容

《混合专家模型推理优化技术综述》

《混合专家模型推理优化技术综述》

专知会员服务

45+阅读 · 2024年12月21日

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

专知会员服务

44+阅读 · 2023年9月3日

【牛津大学博士论文】随机过程非线性鲁棒独立分量分析，245页pdf

【牛津大学博士论文】随机过程非线性鲁棒独立分量分析，245页pdf

专知会员服务

22+阅读 · 2023年1月8日

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

专知会员服务

87+阅读 · 2022年10月16日

【AI+军事】附论文《处理混合冲突中的不确定性：情报分析中不确定性量化的新方法和模型》

【AI+军事】附论文《处理混合冲突中的不确定性：情报分析中不确定性量化的新方法和模型》

专知会员服务

66+阅读 · 2022年5月2日

【AI+军事】附论文《全社会混合冲突的评估：活动信号与分析家洞察力的融合》

【AI+军事】附论文《全社会混合冲突的评估：活动信号与分析家洞察力的融合》

专知会员服务

31+阅读 · 2022年4月28日

【新书稿】数据科学的谱方法:统计的视角,168页pdf

【新书稿】数据科学的谱方法:统计的视角,168页pdf

专知会员服务

58+阅读 · 2021年10月28日

知识图谱嵌入模型的概率标定,Probability Calibration for Knowledge Graph Embedding Models

专知会员服务

36+阅读 · 2020年5月11日

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

专知会员服务

174+阅读 · 2020年5月1日

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

【NeurIPS 2019|经典论文奖】正则随机学习和在线优化的双重平均法（Dual Averaging Method for Regularized Stochastic Learning and Online Optimization），微软研究院Lin Xiao

专知会员服务

17+阅读 · 2019年12月9日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

专知

12+阅读 · 2022年4月15日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

详解GAN的谱归一化（Spectral Normalization）

详解GAN的谱归一化（Spectral Normalization）

PaperWeekly

11+阅读 · 2019年2月13日

论文浅尝 | Interaction Embeddings for Prediction and Explanation

论文浅尝 | Interaction Embeddings for Prediction and Explanation

开放知识图谱

11+阅读 · 2019年2月1日

数据分析师应该知道的16种回归技术：偏最小二乘回归

数据分析师应该知道的16种回归技术：偏最小二乘回归

数萃大数据

14+阅读 · 2018年8月29日

综述：深度学习时代的目标检测算法

综述：深度学习时代的目标检测算法

极市平台

27+阅读 · 2018年3月17日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

相关论文

Hessian Spectral Analysis at Foundation Model Scale

Arxiv

0+阅读 · 1月31日

A Deterministic Information Bottleneck Method for Clustering Mixed-Type Data

Arxiv

0+阅读 · 1月29日

Variational autoencoder for inference of nonlinear mixed effect models based on ordinary differential equations

Arxiv

0+阅读 · 1月24日

Spectral decomposition-assisted multi-study factor analysis

Arxiv

0+阅读 · 1月23日

Finite-Sample Inference for Sparsely Permuted Linear Regression

Arxiv

0+阅读 · 1月22日

Cluster-Based Generalized Additive Models Informed by Random Fourier Features

Arxiv

0+阅读 · 1月21日

On Linear Estimators for some Stable Vectors

Arxiv

0+阅读 · 1月14日

Aligning the Spectrum: Hybrid Graph Pre-training and Prompt Tuning across Homophily and Heterophily

Arxiv

0+阅读 · 1月12日

Gaussian Mixture Model with unknown diagonal covariances via continuous sparse regularization

Arxiv

0+阅读 · 1月8日

Causal Discovery with Mixed Latent Confounding via Precision Decomposition

Arxiv

0+阅读 · 2025年12月31日

相关基金

广义混杂系统的降阶分析与应用

国家自然科学基金

1+阅读 · 2015年12月31日

顾及异方差与空间约束的高光谱混合像元模糊聚类分解方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

方差正则化的分类模型选择方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

高性能谱/谱元方法研究及其在多相复杂流体中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

电磁兼容仿真不确定性定量分析方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

四阶微分方程的谱和谱元方法

国家自然科学基金

0+阅读 · 2014年12月31日

短波认知ALE系统中基于深度学习-GP混合模型的多维谱预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

非线性混合效应模型的最优与稳健设计

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员