Massive Memorization with Hundreds of Trillions of Parameters for Sequential Transducer Generative Recommenders - 专知论文

会员服务 ·

0

序列 · 系统 · 推荐系统 · 模型性能 · 分解 ·

Massive Memorization with Hundreds of Trillions of Parameters for Sequential Transducer Generative Recommenders

翻译：基于百兆参数的大规模记忆化序列转换生成式推荐系统

Zhimin Chen,Chenyu Zhao,Ka Chun Mo,Yunjiang Jiang,Jane H. Lee,Khushhall Chandra Mahajan,Ning Jiang,Kai Ren,Jinhui Li,Wen-Yun Yang

Modern large-scale recommendation systems rely heavily on user interaction history sequences to enhance the model performance. The advent of large language models and sequential modeling techniques, particularly transformer-like architectures, has led to significant advancements recently (e.g., HSTU, SIM, and TWIN models). While scaling to ultra-long user histories (10k to 100k items) generally improves model performance, it also creates significant challenges on latency, queries per second (QPS) and GPU cost in industry-scale recommendation systems. Existing models do not adequately address these industrial scalability issues. In this paper, we propose a novel two-stage modeling framework, namely VIrtual Sequential Target Attention (VISTA), which decomposes traditional target attention from a candidate item to user history items into two distinct stages: (1) user history summarization into a few hundred tokens; followed by (2) candidate item attention to those tokens. These summarization token embeddings are then cached in storage system and then utilized as sequence features for downstream model training and inference. This novel design for scalability enables VISTA to scale to lifelong user histories (up to one million items) while keeping downstream training and inference costs fixed, which is essential in industry. Our approach achieves significant improvements in offline and online metrics and has been successfully deployed on an industry leading recommendation platform serving billions of users.

翻译：现代大规模推荐系统高度依赖用户交互历史序列来提升模型性能。大型语言模型与序列建模技术（特别是类Transformer架构）的出现，近期已推动该领域取得显著进展（例如HSTU、SIM和TWIN模型）。尽管扩展至超长用户历史（1万至10万条项目）通常能提升模型性能，但这在工业级推荐系统中也带来了延迟、每秒查询量（QPS）和GPU成本的重大挑战。现有模型未能充分解决这些工业可扩展性问题。本文提出一种新颖的两阶段建模框架——虚拟序列目标注意力（VISTA），该框架将传统从候选项目到用户历史项目的目标注意力分解为两个独立阶段：（1）将用户历史摘要为数百个标记；（2）候选项目对这些标记的注意力计算。这些摘要标记嵌入随后被缓存在存储系统中，并作为序列特征用于下游模型的训练与推理。这种创新的可扩展性设计使VISTA能够扩展至终身用户历史（高达一百万条项目），同时保持下游训练与推理成本固定，这在工业场景中至关重要。我们的方法在离线与在线指标上均取得显著提升，并已成功部署于服务数十亿用户的行业领先推荐平台。

0

相关内容

数学上，序列是被排成一列的对象（或事件）；这样每个元素不是在其他元素之前，就是在其他元素之后。这里，元素之间的顺序非常重要。

基础模型驱动的推荐系统综述：从特征驱动、生成式到智能体范式

基础模型驱动的推荐系统综述：从特征驱动、生成式到智能体范式

专知会员服务

22+阅读 · 2025年4月24日

关于大语言模型驱动的推荐系统智能体的综述

关于大语言模型驱动的推荐系统智能体的综述

专知会员服务

29+阅读 · 2025年2月17日

大规模语言模型增强推荐系统：分类、趋势、应用与未来

大规模语言模型增强推荐系统：分类、趋势、应用与未来

专知会员服务

40+阅读 · 2024年12月22日

大语言模型在序列推荐中的应用

大语言模型在序列推荐中的应用

专知会员服务

19+阅读 · 2024年11月12日

推荐系统与大语言模型技术融合：EMNLP/NeurIPS相关论文导览

推荐系统与大语言模型技术融合：EMNLP/NeurIPS相关论文导览

专知会员服务

20+阅读 · 2024年10月14日

大模型撞上推荐系统

大模型撞上推荐系统

专知会员服务

125+阅读 · 2024年2月27日

RecInterpreter：架起大语言模型与传统推荐模型的桥梁

RecInterpreter：架起大语言模型与传统推荐模型的桥梁

专知会员服务

54+阅读 · 2023年11月9日

大模型如何重塑推荐？香港理工大学等《大型语言模型（LLMs）时代的推荐系统》综述论文，全面阐述LLM+RS技术体系

大模型如何重塑推荐？香港理工大学等《大型语言模型（LLMs）时代的推荐系统》综述论文，全面阐述LLM+RS技术体系

专知会员服务

74+阅读 · 2023年9月3日

大模型如何重塑推荐？中科大等最新《面向推荐的大型语言模型》综述，全面阐述LLM4Rec进展

大模型如何重塑推荐？中科大等最新《面向推荐的大型语言模型》综述，全面阐述LLM4Rec进展

专知会员服务

93+阅读 · 2023年6月1日

【序列推荐系统:挑战、进展和展望】Sequential Recommender Systems

【序列推荐系统:挑战、进展和展望】Sequential Recommender Systems

专知会员服务

82+阅读 · 2020年4月25日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【CIKM2020】多模态知识图谱推荐系统，Multi-modal KG for RS

【CIKM2020】多模态知识图谱推荐系统，Multi-modal KG for RS

专知

33+阅读 · 2020年8月24日

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

AI前线

15+阅读 · 2019年9月22日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

深度学习在推荐系统中的应用综述（最全）

深度学习在推荐系统中的应用综述（最全）

七月在线实验室

17+阅读 · 2018年5月5日

【RecSys2017】基于“翻译”的推荐系统方案，加州大学圣地亚哥分校最新工作（附代码）

【RecSys2017】基于“翻译”的推荐系统方案，加州大学圣地亚哥分校最新工作（附代码）

专知

15+阅读 · 2018年3月21日

深度学习在推荐系统上的应用

深度学习在推荐系统上的应用

架构文摘

13+阅读 · 2018年2月22日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

生物序列大数据集模体发现算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于概率计算的大规模MIMO检测方法

国家自然科学基金

1+阅读 · 2015年12月31日

大规模MIMO系统基于结构化压缩感知的信道估计中导频设计新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于增量式方法的大规模动态覆盖信息系统知识约简理论和应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

大数据环境下融合多源信息的推荐系统关键问题研究

国家自然科学基金

6+阅读 · 2014年12月31日

Pre-trained LLMs Meet Sequential Recommenders: Efficient User-Centric Knowledge Distillation

Arxiv

0+阅读 · 4月23日

Rethinking Recommendation Paradigms: From Pipelines to Agentic Recommender Systems

Arxiv

0+阅读 · 4月9日

Multimodal Large Language Models with Adaptive Preference Optimization for Sequential Recommendation

Arxiv

0+阅读 · 4月7日

Massive Memorization with Hundreds of Trillions of Parameters for Sequential Transducer Generative Recommenders

Arxiv

0+阅读 · 3月26日

Deep Research for Recommender Systems

Arxiv

0+阅读 · 3月8日

SORT: A Systematically Optimized Ranking Transformer for Industrial-scale Recommenders

Arxiv

0+阅读 · 3月4日

Beyond the Flat Sequence: Hierarchical and Preference-Aware Generative Recommendations

Arxiv

0+阅读 · 3月1日

Fine-grained Semantics Integration for Large Language Model-based Recommendation

Arxiv

0+阅读 · 2月28日

GrIT: Group Informed Transformer for Sequential Recommendation

Arxiv

0+阅读 · 2月23日

Bending the Scaling Law Curve in Large-Scale Recommendation Systems

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

1+阅读 · 今天13:56

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

1+阅读 · 今天13:54

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

4+阅读 · 今天8:18

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

专知会员服务

3+阅读 · 今天7:39

《通用大语言模型：无人机指挥与控制接口》最新40页

《通用大语言模型：无人机指挥与控制接口》最新40页

专知会员服务

10+阅读 · 今天7:33

《通过小型无人机系统将情报能力“作战化”》

《通过小型无人机系统将情报能力“作战化”》

专知会员服务

3+阅读 · 今天7:28

《神经安全型有人–无人协同：面向认知自适应作战能力的参考架构》

《神经安全型有人–无人协同：面向认知自适应作战能力的参考架构》

专知会员服务

6+阅读 · 今天7:14

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

专知会员服务

19+阅读 · 6月15日

消耗优势：美军的“精确规模化”概念

消耗优势：美军的“精确规模化”概念

专知会员服务

8+阅读 · 6月15日

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

专知会员服务

9+阅读 · 6月15日

《网络空间兵棋推演：挑战、局限性与混合路径》报告

《网络空间兵棋推演：挑战、局限性与混合路径》报告

专知会员服务

9+阅读 · 6月15日

《离线语言支持系统：面向空战战术决策》

《离线语言支持系统：面向空战战术决策》

专知会员服务

8+阅读 · 6月15日

《以通信为中心的6G–LLM架构：面向可扩展的战术自主防御车辆网络》

《以通信为中心的6G–LLM架构：面向可扩展的战术自主防御车辆网络》

专知会员服务

8+阅读 · 6月15日

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

专知会员服务

6+阅读 · 6月14日

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

专知会员服务

6+阅读 · 6月14日

相关VIP内容

基础模型驱动的推荐系统综述：从特征驱动、生成式到智能体范式

基础模型驱动的推荐系统综述：从特征驱动、生成式到智能体范式

专知会员服务

22+阅读 · 2025年4月24日

关于大语言模型驱动的推荐系统智能体的综述

关于大语言模型驱动的推荐系统智能体的综述

专知会员服务

29+阅读 · 2025年2月17日

大规模语言模型增强推荐系统：分类、趋势、应用与未来

大规模语言模型增强推荐系统：分类、趋势、应用与未来

专知会员服务

40+阅读 · 2024年12月22日

大语言模型在序列推荐中的应用

大语言模型在序列推荐中的应用

专知会员服务

19+阅读 · 2024年11月12日

推荐系统与大语言模型技术融合：EMNLP/NeurIPS相关论文导览

推荐系统与大语言模型技术融合：EMNLP/NeurIPS相关论文导览

专知会员服务

20+阅读 · 2024年10月14日

大模型撞上推荐系统

大模型撞上推荐系统

专知会员服务

125+阅读 · 2024年2月27日

RecInterpreter：架起大语言模型与传统推荐模型的桥梁

RecInterpreter：架起大语言模型与传统推荐模型的桥梁

专知会员服务

54+阅读 · 2023年11月9日

大模型如何重塑推荐？香港理工大学等《大型语言模型（LLMs）时代的推荐系统》综述论文，全面阐述LLM+RS技术体系

大模型如何重塑推荐？香港理工大学等《大型语言模型（LLMs）时代的推荐系统》综述论文，全面阐述LLM+RS技术体系

专知会员服务

74+阅读 · 2023年9月3日

大模型如何重塑推荐？中科大等最新《面向推荐的大型语言模型》综述，全面阐述LLM4Rec进展

大模型如何重塑推荐？中科大等最新《面向推荐的大型语言模型》综述，全面阐述LLM4Rec进展

专知会员服务

93+阅读 · 2023年6月1日

【序列推荐系统:挑战、进展和展望】Sequential Recommender Systems

【序列推荐系统:挑战、进展和展望】Sequential Recommender Systems

专知会员服务

82+阅读 · 2020年4月25日

热门VIP内容

开通专知VIP会员享更多权益服务

多模态代码智能综述：从视觉输入到可执行代码系统

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【CIKM2020】多模态知识图谱推荐系统，Multi-modal KG for RS

【CIKM2020】多模态知识图谱推荐系统，Multi-modal KG for RS

专知

33+阅读 · 2020年8月24日

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

AI前线

15+阅读 · 2019年9月22日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

深度学习在推荐系统中的应用综述（最全）

深度学习在推荐系统中的应用综述（最全）

七月在线实验室

17+阅读 · 2018年5月5日

【RecSys2017】基于“翻译”的推荐系统方案，加州大学圣地亚哥分校最新工作（附代码）

【RecSys2017】基于“翻译”的推荐系统方案，加州大学圣地亚哥分校最新工作（附代码）

专知

15+阅读 · 2018年3月21日

深度学习在推荐系统上的应用

深度学习在推荐系统上的应用

架构文摘

13+阅读 · 2018年2月22日

相关论文

Pre-trained LLMs Meet Sequential Recommenders: Efficient User-Centric Knowledge Distillation

Arxiv

0+阅读 · 4月23日

Rethinking Recommendation Paradigms: From Pipelines to Agentic Recommender Systems

Arxiv

0+阅读 · 4月9日

Multimodal Large Language Models with Adaptive Preference Optimization for Sequential Recommendation

Arxiv

0+阅读 · 4月7日

Massive Memorization with Hundreds of Trillions of Parameters for Sequential Transducer Generative Recommenders

Arxiv

0+阅读 · 3月26日

Deep Research for Recommender Systems

Arxiv

0+阅读 · 3月8日

SORT: A Systematically Optimized Ranking Transformer for Industrial-scale Recommenders

Arxiv

0+阅读 · 3月4日

Beyond the Flat Sequence: Hierarchical and Preference-Aware Generative Recommendations

Arxiv

0+阅读 · 3月1日

Fine-grained Semantics Integration for Large Language Model-based Recommendation

Arxiv

0+阅读 · 2月28日

GrIT: Group Informed Transformer for Sequential Recommendation

Arxiv

0+阅读 · 2月23日

Bending the Scaling Law Curve in Large-Scale Recommendation Systems

Arxiv

0+阅读 · 2月20日

相关基金

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

生物序列大数据集模体发现算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于概率计算的大规模MIMO检测方法

国家自然科学基金

1+阅读 · 2015年12月31日

大规模MIMO系统基于结构化压缩感知的信道估计中导频设计新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于增量式方法的大规模动态覆盖信息系统知识约简理论和应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

大数据环境下融合多源信息的推荐系统关键问题研究

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员