Nonnegative Matrix Factorization in the Component-Wise L1 Norm for Sparse Data - 专知论文

会员服务 ·

0

稀疏 · 稀疏数据 · 分解 · 噪声 · 非负矩阵分解 ·

Nonnegative Matrix Factorization in the Component-Wise L1 Norm for Sparse Data

翻译：稀疏数据的分量L1范数非负矩阵分解

Giovanni Seraghiti,Kévin Dubrulle,Arnaud Vandaele,Nicolas Gillis

from arxiv, 21 pages before supplementary, code available from https://github.com/giovanniseraghiti/wL1-NMF

Nonnegative matrix factorization (NMF) approximates a nonnegative matrix, $X$, by the product of two nonnegative factors, $WH$, where $W$ has $r$ columns and $H$ has $r$ rows. In this paper, we consider NMF using the component-wise L1 norm as the error measure (L1-NMF), which is suited for data corrupted by heavy-tailed noise, such as Laplace noise or salt and pepper noise, or in the presence of outliers. Our first contribution is an NP-hardness proof for L1-NMF, even when $r=1$, in contrast to the standard NMF that uses least squares. Our second contribution is to show that L1-NMF strongly enforces sparsity in the factors for sparse input matrices, thereby favoring interpretability. However, if the data is affected by false zeros, too sparse solutions might degrade the model. Our third contribution is a new, more general, L1-NMF model for sparse data, dubbed weighted L1-NMF (wL1-NMF), where the sparsity of the factorization is controlled by adding a penalization parameter to the entries of $WH$ associated with zeros in the data. The fourth contribution is a new coordinate descent (CD) approach for wL1-NMF, denoted as sparse CD (sCD), where each subproblem is solved by a weighted median algorithm. To the best of our knowledge, sCD is the first algorithm for L1-NMF whose complexity scales with the number of nonzero entries in the data, making it efficient in handling large-scale, sparse data. We perform extensive numerical experiments on synthetic and real-world data to show the effectiveness of our new proposed model (wL1-NMF) and algorithm (sCD).

翻译：非负矩阵分解（NMF）将非负矩阵$X$近似表示为两个非负因子$WH$的乘积，其中$W$有$r$列、$H$有$r$行。本文研究采用分量L1范数作为误差度量的NMF（L1-NMF），该方法适用于受重尾噪声（如拉普拉斯噪声、椒盐噪声）干扰或存在异常值的数据。我们的第一个贡献是证明L1-NMF的NP难性，即便在$r=1$时也成立——这与采用最小二乘法的标准NMF形成对比。第二个贡献是表明对于稀疏输入矩阵，L1-NMF会强力促使因子稀疏化，从而提升可解释性。然而，若数据受到零值误判影响，过于稀疏的解可能会降低模型性能。第三个贡献是针对稀疏数据提出一种更通用的新型L1-NMF模型，称为加权L1-NMF（wL1-NMF），其通过对$WH$中与数据零值对应的元素添加惩罚参数来控制分解的稀疏度。第四个贡献是为wL1-NMF设计了一种新的坐标下降（CD）方法——稀疏坐标下降（sCD），其中每个子问题通过加权中值算法求解。据我们所知，sCD是首个时间复杂度与数据非零元素数量成比例的L1-NMF算法，使其能高效处理大规模稀疏数据。我们在合成和真实数据上进行了大量数值实验，验证了所提新模型（wL1-NMF）与算法（sCD）的有效性。

0

相关内容

【MIT博士论文】稀疏与低秩矩阵优化在机器学习应用中的进展

【MIT博士论文】稀疏与低秩矩阵优化在机器学习应用中的进展

专知会员服务

19+阅读 · 2024年11月15日

【MIT博士论文】机器学习应用中稀疏和低秩矩阵优化的进展

【MIT博士论文】机器学习应用中稀疏和低秩矩阵优化的进展

专知会员服务

28+阅读 · 2024年11月9日

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

专知会员服务

34+阅读 · 2024年10月17日

层次和神经非负张量分解，90页ppt

层次和神经非负张量分解，90页ppt

专知会员服务

24+阅读 · 2022年12月25日

【IEEE ICASSP 2022教程】非负矩阵分解的最新进展，266页ppt

【IEEE ICASSP 2022教程】非负矩阵分解的最新进展，266页ppt

专知会员服务

79+阅读 · 2022年5月28日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

如何深入理解矩阵？184页《矩阵分解与应用》2022新书全面阐述矩阵分解原理、体系与应用

如何深入理解矩阵？184页《矩阵分解与应用》2022新书全面阐述矩阵分解原理、体系与应用

专知会员服务

172+阅读 · 2022年1月10日

低秩稀疏矩阵优化问题的模型与算法

专知会员服务

46+阅读 · 2020年7月29日

【ICML2020】序数非负矩阵分解推荐，On the Number of Linear Regions of Convolutional Neural Networks

【ICML2020】序数非负矩阵分解推荐，On the Number of Linear Regions of Convolutional Neural Networks

专知会员服务

17+阅读 · 2020年6月4日

最新《推荐系统中的对抗性机器学习:现状和挑战》2020综述论文，35页pdf

专知会员服务

91+阅读 · 2020年5月23日

推荐系统之矩阵分解家族

推荐系统之矩阵分解家族

图与推荐

13+阅读 · 2020年3月28日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

从模型到应用，一文读懂因子分解机

从模型到应用，一文读懂因子分解机

AI100

10+阅读 · 2019年9月6日

【初学者系列】Factorization Machines 因子分解机详解

【初学者系列】Factorization Machines 因子分解机详解

专知

37+阅读 · 2019年8月17日

L1和L2正则先验分别服从什么分布

L1和L2正则先验分别服从什么分布

七月在线实验室

11+阅读 · 2019年5月8日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

数据分析师应该知道的16种回归方法：泊松回归

数据分析师应该知道的16种回归方法：泊松回归

数萃大数据

35+阅读 · 2018年9月13日

入门 | 奇异值分解简介：从原理到基础机器学习应用

入门 | 奇异值分解简介：从原理到基础机器学习应用

机器之心

16+阅读 · 2018年3月1日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

正交非负矩阵分解的算法、理论与应用

国家自然科学基金

8+阅读 · 2017年12月31日

稀疏表达下社会化正则方法与低秩分解推荐模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构体系结构的稀疏矩阵分解算法并行化研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏理论和图Laplacian矩阵的图像去噪理论与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

矩阵低秩稀疏分解的两步凸松弛法研究

国家自然科学基金

2+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于L21范数约束的非负矩阵分解模型及其拓展

国家自然科学基金

1+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

分数阶偏微分方程与近场动力学等非局部模型的高保真快速算法与数值分析

国家自然科学基金

1+阅读 · 2014年12月31日

Efficient Decision Procedures for RNmatrix Semantics

Arxiv

0+阅读 · 5月3日

A Unified Fractional Regularization Framework for Sparse Recovery

Arxiv

0+阅读 · 4月25日

Partitioning Unstructured Sparse Tensor Algebra for Load-Balanced Parallel Execution

Arxiv

0+阅读 · 4月22日

Partitioning Unstructured Sparse Tensor Algebra for Load-Balanced Parallel Execution

Arxiv

0+阅读 · 4月19日

PackSELL: A Sparse Matrix Format for Precision-Agnostic High-Performance SpMV

Arxiv

0+阅读 · 4月15日

Information-Geometric Decomposition of Generalization Error in Unsupervised Learning

Arxiv

0+阅读 · 4月14日

Data-Efficient Non-Gaussian Semi-Nonparametric Density Estimation for Nonlinear Dynamical Systems

Arxiv

0+阅读 · 4月10日

Distributed Variational Quantum Linear Solver

Arxiv

0+阅读 · 4月1日

Accelerating Matrix Factorization by Dynamic Pruning for Fast Recommendation

Arxiv

0+阅读 · 3月25日

Towards The Implicit Bias on Multiclass Separable Data Under Norm Constraints

Arxiv

0+阅读 · 3月24日

VIP会员

文章信息

相关主题

非负矩阵分解

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

2+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

2+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

3+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【MIT博士论文】稀疏与低秩矩阵优化在机器学习应用中的进展

【MIT博士论文】稀疏与低秩矩阵优化在机器学习应用中的进展

专知会员服务

19+阅读 · 2024年11月15日

【MIT博士论文】机器学习应用中稀疏和低秩矩阵优化的进展

【MIT博士论文】机器学习应用中稀疏和低秩矩阵优化的进展

专知会员服务

28+阅读 · 2024年11月9日

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

专知会员服务

34+阅读 · 2024年10月17日

层次和神经非负张量分解，90页ppt

层次和神经非负张量分解，90页ppt

专知会员服务

24+阅读 · 2022年12月25日

【IEEE ICASSP 2022教程】非负矩阵分解的最新进展，266页ppt

【IEEE ICASSP 2022教程】非负矩阵分解的最新进展，266页ppt

专知会员服务

79+阅读 · 2022年5月28日

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

【CMU-Yuejie Chi等干货书】满足低秩矩阵分解的非凸优化综述，69页pdf，Nonconvex Optimization Meets Low-Rank Matrix Factorization: An Overview

专知会员服务

33+阅读 · 2022年3月4日

如何深入理解矩阵？184页《矩阵分解与应用》2022新书全面阐述矩阵分解原理、体系与应用

如何深入理解矩阵？184页《矩阵分解与应用》2022新书全面阐述矩阵分解原理、体系与应用

专知会员服务

172+阅读 · 2022年1月10日

低秩稀疏矩阵优化问题的模型与算法

专知会员服务

46+阅读 · 2020年7月29日

【ICML2020】序数非负矩阵分解推荐，On the Number of Linear Regions of Convolutional Neural Networks

【ICML2020】序数非负矩阵分解推荐，On the Number of Linear Regions of Convolutional Neural Networks

专知会员服务

17+阅读 · 2020年6月4日

最新《推荐系统中的对抗性机器学习:现状和挑战》2020综述论文，35页pdf

专知会员服务

91+阅读 · 2020年5月23日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

推荐系统之矩阵分解家族

推荐系统之矩阵分解家族

图与推荐

13+阅读 · 2020年3月28日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

从模型到应用，一文读懂因子分解机

从模型到应用，一文读懂因子分解机

AI100

10+阅读 · 2019年9月6日

【初学者系列】Factorization Machines 因子分解机详解

【初学者系列】Factorization Machines 因子分解机详解

专知

37+阅读 · 2019年8月17日

L1和L2正则先验分别服从什么分布

L1和L2正则先验分别服从什么分布

七月在线实验室

11+阅读 · 2019年5月8日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

数据分析师应该知道的16种回归方法：泊松回归

数据分析师应该知道的16种回归方法：泊松回归

数萃大数据

35+阅读 · 2018年9月13日

入门 | 奇异值分解简介：从原理到基础机器学习应用

入门 | 奇异值分解简介：从原理到基础机器学习应用

机器之心

16+阅读 · 2018年3月1日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

相关论文

Efficient Decision Procedures for RNmatrix Semantics

Arxiv

0+阅读 · 5月3日

A Unified Fractional Regularization Framework for Sparse Recovery

Arxiv

0+阅读 · 4月25日

Partitioning Unstructured Sparse Tensor Algebra for Load-Balanced Parallel Execution

Arxiv

0+阅读 · 4月22日

Partitioning Unstructured Sparse Tensor Algebra for Load-Balanced Parallel Execution

Arxiv

0+阅读 · 4月19日

PackSELL: A Sparse Matrix Format for Precision-Agnostic High-Performance SpMV

Arxiv

0+阅读 · 4月15日

Information-Geometric Decomposition of Generalization Error in Unsupervised Learning

Arxiv

0+阅读 · 4月14日

Data-Efficient Non-Gaussian Semi-Nonparametric Density Estimation for Nonlinear Dynamical Systems

Arxiv

0+阅读 · 4月10日

Distributed Variational Quantum Linear Solver

Arxiv

0+阅读 · 4月1日

Accelerating Matrix Factorization by Dynamic Pruning for Fast Recommendation

Arxiv

0+阅读 · 3月25日

Towards The Implicit Bias on Multiclass Separable Data Under Norm Constraints

Arxiv

0+阅读 · 3月24日

相关基金

正交非负矩阵分解的算法、理论与应用

国家自然科学基金

8+阅读 · 2017年12月31日

稀疏表达下社会化正则方法与低秩分解推荐模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构体系结构的稀疏矩阵分解算法并行化研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏理论和图Laplacian矩阵的图像去噪理论与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

矩阵低秩稀疏分解的两步凸松弛法研究

国家自然科学基金

2+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于L21范数约束的非负矩阵分解模型及其拓展

国家自然科学基金

1+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

分数阶偏微分方程与近场动力学等非局部模型的高保真快速算法与数值分析

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员