Efficient Learning of Sparse Representations from Interactions - 专知论文

会员服务 ·

0

嵌入 · 表示 · 交互 · 稀疏 · 稀疏编码 ·

Efficient Learning of Sparse Representations from Interactions

翻译：高效学习交互数据中的稀疏表示

Vojtěch Vančura,Martin Spišák,Rodrigo Alves,Ladislav Peška

from arxiv, In the proceedings of the Web Conference (WWW) 2026 (4 pages)

Behavioral patterns captured in embeddings learned from interaction data are pivotal across various stages of production recommender systems. However, in the initial retrieval stage, practitioners face an inherent tradeoff between embedding expressiveness and the scalability and latency of serving components, resulting in the need for representations that are both compact and expressive. To address this challenge, we propose a training strategy for learning high-dimensional sparse embedding layers in place of conventional dense ones, balancing efficiency, representational expressiveness, and interpretability. To demonstrate our approach, we modified the production-grade collaborative filtering autoencoder ELSA, achieving up to 10x reduction in embedding size with no loss of recommendation accuracy, and up to 100x reduction with only a 2.5% loss. Moreover, the active embedding dimensions reveal an interpretable inverted-index structure that segments items in a way directly aligned with the model's latent space, thereby enabling integration of segment-level recommendation functionality (e.g., 2D homepage layouts) within the candidate retrieval model itself. Source codes, additional results, as well as a live demo are available at https://github.com/zombak79/compressed_elsa

翻译：从交互数据中学习得到的嵌入所捕获的行为模式，在生产推荐系统的各个阶段都至关重要。然而，在初始检索阶段，从业者面临着嵌入表达能力与服务组件的可扩展性及延迟之间的固有权衡，这导致需要既紧凑又具有表达能力的表示。为应对这一挑战，我们提出了一种训练策略，用于学习高维稀疏嵌入层以替代传统的密集嵌入层，从而在效率、表示能力和可解释性之间取得平衡。为验证我们的方法，我们修改了生产级协同过滤自编码器ELSA，实现了嵌入大小最多减少10倍而推荐精度无损失，以及最多减少100倍而精度仅损失2.5%。此外，活跃的嵌入维度揭示了一种可解释的倒排索引结构，该结构以一种与模型潜在空间直接对齐的方式对物品进行分割，从而使得候选检索模型本身能够集成分段级别的推荐功能（例如，二维主页布局）。源代码、额外结果以及在线演示可在 https://github.com/zombak79/compressed_elsa 获取。

0

相关内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

9+阅读 · 2月9日

表格数据表示学习综述

表格数据表示学习综述

专知会员服务

18+阅读 · 2025年4月27日

【阿姆斯特丹博士论文】表格表示学习，179页pdf

【阿姆斯特丹博士论文】表格表示学习，179页pdf

专知会员服务

36+阅读 · 2024年4月6日

【CMU博士论文】高效且可扩展的表示学习,152页pdf

【CMU博士论文】高效且可扩展的表示学习,152页pdf

专知会员服务

39+阅读 · 2023年6月12日

对比学习需要哪样的数据？UCLA最新ICML2023论文《数据高效对比学习：简单样本贡献最大》，探究量化样本对SSL的贡献度

对比学习需要哪样的数据？UCLA最新ICML2023论文《数据高效对比学习：简单样本贡献最大》，探究量化样本对SSL的贡献度

专知会员服务

37+阅读 · 2023年5月14日

【剑桥大学博士论文】具有关系结构的元学习表示，221页pdf

【剑桥大学博士论文】具有关系结构的元学习表示，221页pdf

专知会员服务

42+阅读 · 2023年2月21日

推荐如何用元学习？上海交大最新《深度元学习推荐系统综述》，40页pdf涵盖135篇文献阐述深度学习元学习推荐方法体系

推荐如何用元学习？上海交大最新《深度元学习推荐系统综述》，40页pdf涵盖135篇文献阐述深度学习元学习推荐方法体系

专知会员服务

53+阅读 · 2022年6月14日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

专知会员服务

63+阅读 · 2020年5月23日

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

专知会员服务

29+阅读 · 2019年11月15日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

华为分享异质图表示学习（异质图神经网络）

华为分享异质图表示学习（异质图神经网络）

图与推荐

14+阅读 · 2020年9月10日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

网络表示学习概述

网络表示学习概述

机器学习与推荐算法

20+阅读 · 2020年3月27日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

Representation Learning on Network 网络表示学习

Representation Learning on Network 网络表示学习

全球人工智能

10+阅读 · 2017年10月19日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于渐进结构化学习的高维信息稀疏表示理论与技术

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用

国家自然科学基金

3+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Dataset Distillation Efficiently Encodes Low-Dimensional Representations from Gradient-Based Learning of Non-Linear Tasks

Arxiv

0+阅读 · 3月16日

Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

Arxiv

0+阅读 · 3月7日

Sparse Additive Model Pruning for Order-Based Causal Structure Learning

Arxiv

0+阅读 · 2月17日

Compress, Cross and Scale: Multi-Level Compression Cross Networks for Efficient Scaling in Recommender Systems

Arxiv

0+阅读 · 2月12日

TabNSA: Native Sparse Attention for Efficient Tabular Data Learning

Arxiv

0+阅读 · 2月10日

High Fidelity Textual User Representation over Heterogeneous Sources via Reinforcement Learning

Arxiv

0+阅读 · 2月7日

Sparse-to-Sparse Training of Diffusion Models

Arxiv

0+阅读 · 2月4日

Understanding and Exploiting Weight Update Sparsity for Communication-Efficient Distributed RL

Arxiv

0+阅读 · 2月3日

Orthogonal Hierarchical Decomposition for Structure-Aware Table Understanding with Large Language Models

Arxiv

0+阅读 · 2月2日

TraceLLM: Leveraging Large Language Models with Prompt Engineering for Enhanced Requirements Traceability

Arxiv

0+阅读 · 2月1日

VIP会员

文章信息

相关主题

最新内容

乌军利用美国“黄蜂”无人机摧毁俄军后勤

乌军利用美国“黄蜂”无人机摧毁俄军后勤

专知会员服务

1+阅读 · 今天14:53

《支持作战级人机协同智能的交互式OODA流程》

《支持作战级人机协同智能的交互式OODA流程》

专知会员服务

4+阅读 · 今天14:46

《军事地面机动的概率等时分析：未来自适应模型的多方法协同》

《军事地面机动的概率等时分析：未来自适应模型的多方法协同》

专知会员服务

1+阅读 · 今天14:42

大语言模型与物联网：大语言模型与物联网融合全面综述

大语言模型与物联网：大语言模型与物联网融合全面综述

专知会员服务

3+阅读 · 今天14:35

【伯克利博士论文】基于动作分块策略的强化学习

【伯克利博士论文】基于动作分块策略的强化学习

专知会员服务

1+阅读 · 今天13:50

Transformer增强强化学习：通信网络基础与应用综述

Transformer增强强化学习：通信网络基础与应用综述

专知会员服务

1+阅读 · 今天13:47

ICML 2026 | SARDI：扩散语言模型的自增强检索

ICML 2026 | SARDI：扩散语言模型的自增强检索

专知会员服务

6+阅读 · 6月6日

长时程具身智能安全综述：机器人操作的跨层分析

长时程具身智能安全综述：机器人操作的跨层分析

专知会员服务

8+阅读 · 6月6日

从“杀伤链”到“杀伤网”：新时代防空反导体系的真正需求

从“杀伤链”到“杀伤网”：新时代防空反导体系的真正需求

专知会员服务

12+阅读 · 6月6日

《锻造军官能力：军官发展的军事训练、学术教育及设计思维导向创新的多维度研究》最新300页

《锻造军官能力：军官发展的军事训练、学术教育及设计思维导向创新的多维度研究》最新300页

专知会员服务

7+阅读 · 6月6日

《国防领域安全采用大语言模型的战略蓝图》

《国防领域安全采用大语言模型的战略蓝图》

专知会员服务

9+阅读 · 6月6日

《对抗性电磁环境下远程巡飞弹作战的保密指挥控制数据链》

《对抗性电磁环境下远程巡飞弹作战的保密指挥控制数据链》

专知会员服务

10+阅读 · 6月6日

CVPR2026奖项公布，谷歌D4RT最佳论文获奖，何恺明ResNet、YOLO获时间检验奖！

CVPR2026奖项公布，谷歌D4RT最佳论文获奖，何恺明ResNet、YOLO获时间检验奖！

专知会员服务

7+阅读 · 6月6日

ICML 2026 | 演化选择的因果建模

ICML 2026 | 演化选择的因果建模

专知会员服务

10+阅读 · 6月5日

综述｜学习式3D表征最新进展与趋势

综述｜学习式3D表征最新进展与趋势

专知会员服务

7+阅读 · 6月5日

相关VIP内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

9+阅读 · 2月9日

表格数据表示学习综述

表格数据表示学习综述

专知会员服务

18+阅读 · 2025年4月27日

【阿姆斯特丹博士论文】表格表示学习，179页pdf

【阿姆斯特丹博士论文】表格表示学习，179页pdf

专知会员服务

36+阅读 · 2024年4月6日

【CMU博士论文】高效且可扩展的表示学习,152页pdf

【CMU博士论文】高效且可扩展的表示学习,152页pdf

专知会员服务

39+阅读 · 2023年6月12日

对比学习需要哪样的数据？UCLA最新ICML2023论文《数据高效对比学习：简单样本贡献最大》，探究量化样本对SSL的贡献度

对比学习需要哪样的数据？UCLA最新ICML2023论文《数据高效对比学习：简单样本贡献最大》，探究量化样本对SSL的贡献度

专知会员服务

37+阅读 · 2023年5月14日

【剑桥大学博士论文】具有关系结构的元学习表示，221页pdf

【剑桥大学博士论文】具有关系结构的元学习表示，221页pdf

专知会员服务

42+阅读 · 2023年2月21日

推荐如何用元学习？上海交大最新《深度元学习推荐系统综述》，40页pdf涵盖135篇文献阐述深度学习元学习推荐方法体系

推荐如何用元学习？上海交大最新《深度元学习推荐系统综述》，40页pdf涵盖135篇文献阐述深度学习元学习推荐方法体系

专知会员服务

53+阅读 · 2022年6月14日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

专知会员服务

63+阅读 · 2020年5月23日

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

专知会员服务

29+阅读 · 2019年11月15日

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

【CCF优秀博士学位论文奖-2019】表示学习的高效算法，清华大学陈健飞

专知会员服务

48+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《支持作战级人机协同智能的交互式OODA流程》

大语言模型与物联网：大语言模型与物联网融合全面综述

乌军利用美国“黄蜂”无人机摧毁俄军后勤

《军事地面机动的概率等时分析：未来自适应模型的多方法协同》

相关资讯

华为分享异质图表示学习（异质图神经网络）

华为分享异质图表示学习（异质图神经网络）

图与推荐

14+阅读 · 2020年9月10日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

网络表示学习概述

网络表示学习概述

机器学习与推荐算法

20+阅读 · 2020年3月27日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

无监督元学习表示学习

无监督元学习表示学习

CreateAMind

27+阅读 · 2019年1月4日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

Representation Learning on Network 网络表示学习

Representation Learning on Network 网络表示学习

全球人工智能

10+阅读 · 2017年10月19日

相关论文

Dataset Distillation Efficiently Encodes Low-Dimensional Representations from Gradient-Based Learning of Non-Linear Tasks

Arxiv

0+阅读 · 3月16日

Efficient Personalized Reranking with Semi-Autoregressive Generation and Online Knowledge Distillation

Arxiv

0+阅读 · 3月7日

Sparse Additive Model Pruning for Order-Based Causal Structure Learning

Arxiv

0+阅读 · 2月17日

Compress, Cross and Scale: Multi-Level Compression Cross Networks for Efficient Scaling in Recommender Systems

Arxiv

0+阅读 · 2月12日

TabNSA: Native Sparse Attention for Efficient Tabular Data Learning

Arxiv

0+阅读 · 2月10日

High Fidelity Textual User Representation over Heterogeneous Sources via Reinforcement Learning

Arxiv

0+阅读 · 2月7日

Sparse-to-Sparse Training of Diffusion Models

Arxiv

0+阅读 · 2月4日

Understanding and Exploiting Weight Update Sparsity for Communication-Efficient Distributed RL

Arxiv

0+阅读 · 2月3日

Orthogonal Hierarchical Decomposition for Structure-Aware Table Understanding with Large Language Models

Arxiv

0+阅读 · 2月2日

TraceLLM: Leveraging Large Language Models with Prompt Engineering for Enhanced Requirements Traceability

Arxiv

0+阅读 · 2月1日

相关基金

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于渐进结构化学习的高维信息稀疏表示理论与技术

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用

国家自然科学基金

3+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员