Matrix factorization (MF) is a widely used collaborative filtering (CF) algorithm for recommendation systems (RSs), due to its high prediction accuracy, great flexibility and high efficiency in big data processing. However, with the dramatically increased number of users/items in current RSs, the computational complexity for training a MF model largely increases. Many existing works have accelerated MF, by either putting in additional computational resources or utilizing parallel systems, introducing a large cost. In this paper, we propose algorithmic methods to accelerate MF, without inducing any additional computational resources. In specific, we observe fine-grained structured sparsity in the decomposed feature matrices when considering a certain threshold. The fine-grained structured sparsity causes a large amount of unnecessary operations during both matrix multiplication and latent factor update, increasing the computational time of the MF training process. Based on the observation, we firstly propose to rearrange the feature matrices based on joint sparsity, which potentially makes a latent vector with a smaller index more dense than that with a larger index. The feature matrix rearrangement is given to limit the error caused by the later performed pruning process. We then propose to prune the insignificant latent factors by an early stopping process during both matrix multiplication and latent factor update. The pruning process is dynamically performed according to the sparsity of the latent factors for different users/items, to accelerate the process. The experiments show that our method can achieve 1.2-1.65 speedups, with up to 20.08% error increase, compared with the conventional MF training process. We also prove the proposed methods are applicable considering different hyperparameters including optimizer, optimization strategy and initialization method.


翻译:矩阵分解(MF)是一种广泛应用于推荐系统(RS)的协同过滤(CF)算法,因其预测精度高、灵活性强且能高效处理大数据而备受青睐。然而,随着当前推荐系统中用户/物品数量急剧增加,训练MF模型的计算复杂度也大幅上升。现有工作通过增加额外计算资源或利用并行系统来加速MF,但往往引入了高昂成本。本文提出无需额外计算资源的算法级加速方法。具体而言,我们观察到在设定特定阈值时,分解后的特征矩阵中存在细粒度的结构化稀疏性。这种结构化稀疏性会导致矩阵乘法和隐因子更新过程中产生大量不必要操作,从而增加MF训练的计算时间。基于这一观察,我们首先提出基于联合稀疏性对特征矩阵进行重排,使得索引较小的隐向量比索引较大的隐向量更稠密。该特征矩阵重排旨在限制后续剪枝过程带来的误差。随后,我们提出在矩阵乘法和隐因子更新过程中通过提前停止机制剪枝不重要的隐因子。剪枝过程根据不同用户/物品的隐因子稀疏性动态执行,以加速处理。实验表明,与传统MF训练过程相比,本文方法可实现1.2-1.65倍的速度提升,同时误差最多增加20.08%。我们还证明所提方法适用于包括优化器、优化策略和初始化方法在内的不同超参数设置。

0
下载
关闭预览

相关内容

【博士论文】利用图结构加速稀疏计算
专知会员服务
18+阅读 · 2025年3月6日
推荐系统中的扩散模型:综述
专知会员服务
21+阅读 · 2025年1月22日
浅析神经协同过滤NCF在推荐系统的应用
凡人机器学习
15+阅读 · 2020年10月17日
推荐系统之矩阵分解家族
图与推荐
13+阅读 · 2020年3月28日
从模型到应用,一文读懂因子分解机
AI100
10+阅读 · 2019年9月6日
推荐系统算法合集,满满都是干货(建议收藏)
七月在线实验室
17+阅读 · 2018年7月23日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
8+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
10+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
相关资讯
浅析神经协同过滤NCF在推荐系统的应用
凡人机器学习
15+阅读 · 2020年10月17日
推荐系统之矩阵分解家族
图与推荐
13+阅读 · 2020年3月28日
从模型到应用,一文读懂因子分解机
AI100
10+阅读 · 2019年9月6日
推荐系统算法合集,满满都是干货(建议收藏)
七月在线实验室
17+阅读 · 2018年7月23日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员