基于最小消息长度的概率主成分分析 (MML Probabilistic Principal Component Analysis) - 专知论文

会员服务 ·

0

主成分分析 · 分析 · PCA · 概率 · 数据降维 ·

MML Probabilistic Principal Component Analysis

翻译：基于最小消息长度的概率主成分分析

Enes Makalic,Daniel F. Schmidt

Principal component analysis (PCA) is perhaps the most widely used method for data dimensionality reduction. A key question in PCA is deciding how many factors to retain. This manuscript describes a new approach to automatically selecting the number of principal components based on the Bayesian minimum message length method of inductive inference. We derive a new estimate of the isotropic residual variance and demonstrate that it improves on the usual maximum likelihood approach. We also discuss extending this approach to finite mixture models of principal component analyzers.

翻译：主成分分析（PCA）可能是最广泛使用的数据降维方法。PCA中的一个关键问题是决定保留多少因子。本文描述了一种基于贝叶斯最小消息长度归纳推理方法自动选择主成分数量的新途径。我们推导了各向同性残差方差的新估计量，并证明其优于通常的最大似然方法。我们还讨论了将该方法扩展至主成分分析器的有限混合模型。

0

相关内容

主成分分析

主成分分析

在统计中，主成分分析（PCA）是一种通过最大化每个维度的方差来将较高维度空间中的数据投影到较低维度空间中的方法。给定二维，三维或更高维空间中的点集合，可以将“最佳拟合”线定义为最小化从点到线的平均平方距离的线。可以从垂直于第一条直线的方向类似地选择下一条最佳拟合线。重复此过程会产生一个正交的基础，其中数据的不同单个维度是不相关的。这些基向量称为主成分。

【博士论文】用于概率程序与生成模型的变分推断

【博士论文】用于概率程序与生成模型的变分推断

专知会员服务

17+阅读 · 2025年10月27日

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

专知会员服务

76+阅读 · 2022年9月6日

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

专知会员服务

44+阅读 · 2022年3月3日

【香港中文大学】基于Aspect的情感分析综述论文，A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges

【香港中文大学】基于Aspect的情感分析综述论文，A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges

专知会员服务

20+阅读 · 2022年3月3日

【干货书】贝叶斯统计分析方法，697页pdf

【干货书】贝叶斯统计分析方法，697页pdf

专知会员服务

124+阅读 · 2021年12月18日

【LUND博士论文】基于模拟的推断:从近似贝叶斯计算和粒子方法到神经密度估计，223页pdf

【LUND博士论文】基于模拟的推断:从近似贝叶斯计算和粒子方法到神经密度估计，223页pdf

专知会员服务

26+阅读 · 2021年10月8日

经典书最新版《贝叶斯数据分析(第三版)》，677页pdf，哥伦比亚大学《Bayesian Data Analysis, 3ed》

经典书最新版《贝叶斯数据分析(第三版)》，677页pdf，哥伦比亚大学《Bayesian Data Analysis, 3ed》

专知会员服务

254+阅读 · 2020年4月5日

在线变分推断，76页ppt，A Regret Bound for Online Variational Inference

在线变分推断，76页ppt，A Regret Bound for Online Variational Inference

专知会员服务

21+阅读 · 2019年12月2日

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

专知会员服务

35+阅读 · 2019年11月30日

【IPAM 】张量主元分析中的高维成本景观和梯度下降及其推广（High-dimensional cost landscape and gradient descent in Tensor PCA and its generalisations），附41页pdf

【IPAM 】张量主元分析中的高维成本景观和梯度下降及其推广（High-dimensional cost landscape and gradient descent in Tensor PCA and its generalisations），附41页pdf

专知会员服务

14+阅读 · 2019年11月22日

【干货书】贝叶斯推断随机过程，449页pdf

【干货书】贝叶斯推断随机过程，449页pdf

专知

30+阅读 · 2020年8月27日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

数据分析师应该知道的16种回归技术：偏最小二乘回归

数据分析师应该知道的16种回归技术：偏最小二乘回归

数萃大数据

14+阅读 · 2018年8月29日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

概率论之概念解析：用贝叶斯推断进行参数估计

概率论之概念解析：用贝叶斯推断进行参数估计

专知

14+阅读 · 2018年1月8日

机器学习(30)之线性判别分析(LDA)原理详解

机器学习(30)之线性判别分析(LDA)原理详解

机器学习算法与Python学习

11+阅读 · 2017年12月6日

PCA的基本数学原理

PCA的基本数学原理

算法与数学之美

11+阅读 · 2017年8月8日

基于广义强度分布理论的小子样可靠性分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

分数随机微分方程的定性理论研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

超高维生存数据变量筛选和选择中若干问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于部分核实数据的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

关于分数阶偏泛函微分方程基本理论的研究

国家自然科学基金

0+阅读 · 2014年12月31日

Non-linear PCA via Evolution Strategies: a Novel Objective Function

Arxiv

0+阅读 · 2月3日

PCA of probability measures: Sparse and Dense sampling regimes

Arxiv

0+阅读 · 2月2日

Robust functional PCA for relative data

Arxiv

0+阅读 · 1月28日

Learning Logical Rules using Minimum Message Length

Arxiv

0+阅读 · 1月23日

Spectral decomposition-assisted multi-study factor analysis

Arxiv

0+阅读 · 1月23日

Multi-context principal component analysis

Arxiv

0+阅读 · 1月21日

ALPCAHUS: Subspace Clustering for Heteroscedastic Data

Arxiv

0+阅读 · 1月19日

PCA-Guided Quantile Sampling: Preserving Data Structure in Large-Scale Subsampling

Arxiv

0+阅读 · 1月12日

Efficient Data Reduction Via PCA-Guided Quantile Based Sampling

Arxiv

0+阅读 · 1月10日

Deep Deterministic Nonlinear ICA via Total Correlation Minimization with Matrix-Based Entropy Functional

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

主成分分析

相关VIP内容

【博士论文】用于概率程序与生成模型的变分推断

【博士论文】用于概率程序与生成模型的变分推断

专知会员服务

17+阅读 · 2025年10月27日

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

【MIT博士论文】分层概率多模态数据融合研究进展，289页pdf

专知会员服务

76+阅读 · 2022年9月6日

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

香港中文大学最新《基于Aspect的情感分析》综述论文，涵盖近200篇文献阐述ABSA方法体系

专知会员服务

44+阅读 · 2022年3月3日

【香港中文大学】基于Aspect的情感分析综述论文，A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges

【香港中文大学】基于Aspect的情感分析综述论文，A Survey on Aspect-Based Sentiment Analysis: Tasks, Methods, and Challenges

专知会员服务

20+阅读 · 2022年3月3日

【干货书】贝叶斯统计分析方法，697页pdf

【干货书】贝叶斯统计分析方法，697页pdf

专知会员服务

124+阅读 · 2021年12月18日

【LUND博士论文】基于模拟的推断:从近似贝叶斯计算和粒子方法到神经密度估计，223页pdf

【LUND博士论文】基于模拟的推断:从近似贝叶斯计算和粒子方法到神经密度估计，223页pdf

专知会员服务

26+阅读 · 2021年10月8日

经典书最新版《贝叶斯数据分析(第三版)》，677页pdf，哥伦比亚大学《Bayesian Data Analysis, 3ed》

经典书最新版《贝叶斯数据分析(第三版)》，677页pdf，哥伦比亚大学《Bayesian Data Analysis, 3ed》

专知会员服务

254+阅读 · 2020年4月5日

在线变分推断，76页ppt，A Regret Bound for Online Variational Inference

在线变分推断，76页ppt，A Regret Bound for Online Variational Inference

专知会员服务

21+阅读 · 2019年12月2日

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

专知会员服务

35+阅读 · 2019年11月30日

【IPAM 】张量主元分析中的高维成本景观和梯度下降及其推广（High-dimensional cost landscape and gradient descent in Tensor PCA and its generalisations），附41页pdf

【IPAM 】张量主元分析中的高维成本景观和梯度下降及其推广（High-dimensional cost landscape and gradient descent in Tensor PCA and its generalisations），附41页pdf

专知会员服务

14+阅读 · 2019年11月22日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【干货书】贝叶斯推断随机过程，449页pdf

【干货书】贝叶斯推断随机过程，449页pdf

专知

30+阅读 · 2020年8月27日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

数据分析师应该知道的16种回归技术：偏最小二乘回归

数据分析师应该知道的16种回归技术：偏最小二乘回归

数萃大数据

14+阅读 · 2018年8月29日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

概率论之概念解析：用贝叶斯推断进行参数估计

概率论之概念解析：用贝叶斯推断进行参数估计

专知

14+阅读 · 2018年1月8日

机器学习(30)之线性判别分析(LDA)原理详解

机器学习(30)之线性判别分析(LDA)原理详解

机器学习算法与Python学习

11+阅读 · 2017年12月6日

PCA的基本数学原理

PCA的基本数学原理

算法与数学之美

11+阅读 · 2017年8月8日

相关论文

Non-linear PCA via Evolution Strategies: a Novel Objective Function

Arxiv

0+阅读 · 2月3日

PCA of probability measures: Sparse and Dense sampling regimes

Arxiv

0+阅读 · 2月2日

Robust functional PCA for relative data

Arxiv

0+阅读 · 1月28日

Learning Logical Rules using Minimum Message Length

Arxiv

0+阅读 · 1月23日

Spectral decomposition-assisted multi-study factor analysis

Arxiv

0+阅读 · 1月23日

Multi-context principal component analysis

Arxiv

0+阅读 · 1月21日

ALPCAHUS: Subspace Clustering for Heteroscedastic Data

Arxiv

0+阅读 · 1月19日

PCA-Guided Quantile Sampling: Preserving Data Structure in Large-Scale Subsampling

Arxiv

0+阅读 · 1月12日

Efficient Data Reduction Via PCA-Guided Quantile Based Sampling

Arxiv

0+阅读 · 1月10日

Deep Deterministic Nonlinear ICA via Total Correlation Minimization with Matrix-Based Entropy Functional

Arxiv

0+阅读 · 2025年12月31日

相关基金

基于广义强度分布理论的小子样可靠性分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

分数随机微分方程的定性理论研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

超高维生存数据变量筛选和选择中若干问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于部分核实数据的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

关于分数阶偏泛函微分方程基本理论的研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员