单纯形深度线性判别分析 (Simplex Deep Linear Discriminant Analysis) - 专知论文

会员服务 ·

0

LDA · 单纯形 · 线性判别分析 · 判别分析 · 分析 ·

Simplex Deep Linear Discriminant Analysis

翻译：单纯形深度线性判别分析

Maxat Tezekbayev,Arman Bolatov,Zhenisbek Assylbekov

We revisit Deep Linear Discriminant Analysis (Deep LDA) from a likelihood-based perspective. While classical LDA is a simple Gaussian model with linear decision boundaries, attaching an LDA head to a neural encoder raises the question of how to train the resulting deep classifier by maximum likelihood estimation (MLE). We first show that end-to-end MLE training of an unconstrained Deep LDA model ignores discrimination: when both the LDA parameters and the encoder parameters are learned jointly, the likelihood admits a degenerate solution in which some of the class clusters may heavily overlap or even collapse, and classification performance deteriorates. Batchwise moment re-estimation of the LDA parameters does not remove this failure mode. We then propose a constrained Deep LDA formulation that fixes the class means to the vertices of a regular simplex in the latent space and restricts the shared covariance to be spherical, leaving only the priors and a single variance parameter to be learned along with the encoder. Under these geometric constraints, MLE becomes stable and yields well-separated class clusters in the latent space. On images (Fashion-MNIST, CIFAR-10, CIFAR-100), the resulting Deep LDA models achieve accuracy competitive with softmax baselines while offering a simple, interpretable latent geometry that is clearly visible in two-dimensional projections.

翻译：我们从基于似然的角度重新审视深度线性判别分析（Deep LDA）。经典的LDA是一个具有线性决策边界的简单高斯模型，而将LDA头连接到神经编码器上，则引出了如何通过最大似然估计（MLE）来训练由此产生的深度分类器的问题。我们首先证明，对无约束的Deep LDA模型进行端到端的MLE训练会忽略判别性：当LDA参数和编码器参数被联合学习时，似然函数存在一个退化解，其中某些类别的聚类可能严重重叠甚至坍缩，导致分类性能下降。对LDA参数进行逐批次矩重估计并不能消除这种失效模式。接着，我们提出了一种带约束的Deep LDA公式，它将潜在空间中的类别均值固定在一个规则单纯形的顶点上，并将共享协方差限制为球形，仅留下先验概率和一个方差参数与编码器一起学习。在这些几何约束下，MLE变得稳定，并在潜在空间中产生良好分离的类别聚类。在图像数据集（Fashion-MNIST, CIFAR-10, CIFAR-100）上，由此得到的Deep LDA模型实现了与softmax基线相竞争的准确率，同时提供了一个简单、可解释的潜在几何结构，该结构在二维投影中可以清晰地观察到。

0

相关内容

LDA

Deep Research（深度研究）：系统性综述

Deep Research（深度研究）：系统性综述

专知会员服务

50+阅读 · 2025年12月3日

【剑桥大学博士论文】朝向深度贝叶斯模型的改进变分推断，226页pdf

【剑桥大学博士论文】朝向深度贝叶斯模型的改进变分推断，226页pdf

专知会员服务

36+阅读 · 2024年1月29日

【剑桥大学博士论文】深度贝叶斯模型改进的变分推断方法，226页pdf

【剑桥大学博士论文】深度贝叶斯模型改进的变分推断方法，226页pdf

专知会员服务

49+阅读 · 2024年1月13日

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

专知会员服务

22+阅读 · 2022年3月11日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

深度学习图像分割综述论文最新版，Image Segmentation Using Deep Learning: A Survey

深度学习图像分割综述论文最新版，Image Segmentation Using Deep Learning: A Survey

专知会员服务

93+阅读 · 2020年4月11日

【中科院计算所】深几何学习综述:从表征的角度，A Survey on Deep Geometry Learning: From a Representation Perspective

【中科院计算所】深几何学习综述:从表征的角度，A Survey on Deep Geometry Learning: From a Representation Perspective

专知会员服务

51+阅读 · 2020年2月22日

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

专知会员服务

78+阅读 · 2020年2月3日

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

专知会员服务

98+阅读 · 2019年12月31日

【论文推荐】深度学习中贝叶斯不确定性简单基线（A simple baseline for bayesian uncertainty in deep learning）

【论文推荐】深度学习中贝叶斯不确定性简单基线（A simple baseline for bayesian uncertainty in deep learning）

专知会员服务

46+阅读 · 2019年12月25日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【论文推荐】最新六篇情感分析相关论文—深度上下文、支持向量机、两级LSTM、多模态情感分析、软件工程、代码混合

【论文推荐】最新六篇情感分析相关论文—深度上下文、支持向量机、两级LSTM、多模态情感分析、软件工程、代码混合

专知

24+阅读 · 2018年3月31日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

专知

55+阅读 · 2018年1月28日

就喜欢看综述论文：情感分析中的深度学习

就喜欢看综述论文：情感分析中的深度学习

机器之心

13+阅读 · 2018年1月26日

机器学习（4）之线性判别式（附Python源码）

机器学习（4）之线性判别式（附Python源码）

机器学习算法与Python学习

13+阅读 · 2017年7月11日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

非线性分析方法与奇异摄动理论在力学中的若干应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于广义部分线性单指标模型的高维纵向数据统计分析

国家自然科学基金

1+阅读 · 2015年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

某些分形集上拉普拉斯算子的谱分析及相关问题

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Improving the Linearized Laplace Approximation via Quadratic Approximations

Arxiv

0+阅读 · 2月3日

Deep Multivariate Models with Parametric Conditionals

Arxiv

0+阅读 · 2月2日

A simple algorithm for output range analysis for deep neural networks

Arxiv

0+阅读 · 1月27日

Interleaved Latent Visual Reasoning with Selective Perceptual Modeling

Arxiv

0+阅读 · 1月21日

Probabilistic Deep Discriminant Analysis for Wind Blade Segmentation

Arxiv

0+阅读 · 1月20日

Deep Linear Discriminant Analysis Revisited

Arxiv

0+阅读 · 1月4日

Deep Model Fusion: A Survey

Arxiv

14+阅读 · 2023年9月27日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Model Complexity of Deep Learning: A Survey

Arxiv

32+阅读 · 2021年3月8日

Deep Generative Modelling: A Comparative Review of VAEs, GANs, Normalizing Flows, Energy-Based and Autoregressive Models

Arxiv

13+阅读 · 2021年3月8日

VIP会员

文章信息

相关主题

线性判别分析

相关VIP内容

Deep Research（深度研究）：系统性综述

Deep Research（深度研究）：系统性综述

专知会员服务

50+阅读 · 2025年12月3日

【剑桥大学博士论文】朝向深度贝叶斯模型的改进变分推断，226页pdf

【剑桥大学博士论文】朝向深度贝叶斯模型的改进变分推断，226页pdf

专知会员服务

36+阅读 · 2024年1月29日

【剑桥大学博士论文】深度贝叶斯模型改进的变分推断方法，226页pdf

【剑桥大学博士论文】深度贝叶斯模型改进的变分推断方法，226页pdf

专知会员服务

49+阅读 · 2024年1月13日

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

【哥伦比亚大学】复杂网络深度表示的几何和拓扑推理，Geometric and Topological Inference for Deep Representations of Complex Networks

专知会员服务

22+阅读 · 2022年3月11日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

深度学习图像分割综述论文最新版，Image Segmentation Using Deep Learning: A Survey

深度学习图像分割综述论文最新版，Image Segmentation Using Deep Learning: A Survey

专知会员服务

93+阅读 · 2020年4月11日

【中科院计算所】深几何学习综述:从表征的角度，A Survey on Deep Geometry Learning: From a Representation Perspective

【中科院计算所】深几何学习综述:从表征的角度，A Survey on Deep Geometry Learning: From a Representation Perspective

专知会员服务

51+阅读 · 2020年2月22日

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

【MIT深度学习课程】深度序列建模，Deep Sequence Modeling

专知会员服务

78+阅读 · 2020年2月3日

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

【深度图相似学习综述】Deep Graph Similarity Learning: A Survey，29页pdf，117条参考文献

专知会员服务

98+阅读 · 2019年12月31日

【论文推荐】深度学习中贝叶斯不确定性简单基线（A simple baseline for bayesian uncertainty in deep learning）

【论文推荐】深度学习中贝叶斯不确定性简单基线（A simple baseline for bayesian uncertainty in deep learning）

专知会员服务

46+阅读 · 2019年12月25日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【论文推荐】最新六篇情感分析相关论文—深度上下文、支持向量机、两级LSTM、多模态情感分析、软件工程、代码混合

【论文推荐】最新六篇情感分析相关论文—深度上下文、支持向量机、两级LSTM、多模态情感分析、软件工程、代码混合

专知

24+阅读 · 2018年3月31日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

专知

55+阅读 · 2018年1月28日

就喜欢看综述论文：情感分析中的深度学习

就喜欢看综述论文：情感分析中的深度学习

机器之心

13+阅读 · 2018年1月26日

机器学习（4）之线性判别式（附Python源码）

机器学习（4）之线性判别式（附Python源码）

机器学习算法与Python学习

13+阅读 · 2017年7月11日

相关论文

Improving the Linearized Laplace Approximation via Quadratic Approximations

Arxiv

0+阅读 · 2月3日

Deep Multivariate Models with Parametric Conditionals

Arxiv

0+阅读 · 2月2日

A simple algorithm for output range analysis for deep neural networks

Arxiv

0+阅读 · 1月27日

Interleaved Latent Visual Reasoning with Selective Perceptual Modeling

Arxiv

0+阅读 · 1月21日

Probabilistic Deep Discriminant Analysis for Wind Blade Segmentation

Arxiv

0+阅读 · 1月20日

Deep Linear Discriminant Analysis Revisited

Arxiv

0+阅读 · 1月4日

Deep Model Fusion: A Survey

Arxiv

14+阅读 · 2023年9月27日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Model Complexity of Deep Learning: A Survey

Arxiv

32+阅读 · 2021年3月8日

Deep Generative Modelling: A Comparative Review of VAEs, GANs, Normalizing Flows, Energy-Based and Autoregressive Models

Arxiv

13+阅读 · 2021年3月8日

相关基金

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

非线性分析方法与奇异摄动理论在力学中的若干应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于广义部分线性单指标模型的高维纵向数据统计分析

国家自然科学基金

1+阅读 · 2015年12月31日

测量误差数据下约束线性模型的有偏估计及变量选择研究

国家自然科学基金

0+阅读 · 2014年12月31日

某些分形集上拉普拉斯算子的谱分析及相关问题

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员