Field Matters: A Lightweight LLM-enhanced Method for CTR Prediction - 专知论文

会员服务 ·

0

CTR · 大语言模型 · CTR预测 · 集成 · TR ·

Field Matters: A Lightweight LLM-enhanced Method for CTR Prediction

翻译：领域至关重要：一种用于CTR预测的轻量级LLM增强方法

Yu Cui,Feng Liu,Jiawei Chen,Xingyu Lou,Changwang Zhang,Jun Wang,Yuegang Sun,Xiaohu Yang,Can Wang

Click-through rate (CTR) prediction is a fundamental task in modern recommender systems. In recent years, the integration of large language models (LLMs) has been shown to effectively enhance the performance of traditional CTR methods. However, existing LLM-enhanced methods often require extensive processing of detailed textual descriptions for large-scale instances or user/item entities, leading to substantial computational overhead. To address this challenge, this work introduces LLaCTR, a novel and lightweight LLM-enhanced CTR method that employs a field-level enhancement paradigm. Specifically, LLaCTR first utilizes LLMs to distill crucial and lightweight semantic knowledge from small-scale feature fields through self-supervised field-feature fine-tuning. Subsequently, it leverages this field-level semantic knowledge to enhance both feature representation and feature interactions. In our experiments, we integrate LLaCTR with six representative CTR models across four datasets, demonstrating its superior performance in terms of both effectiveness and efficiency compared to existing LLM-enhanced methods. Our code is available at https://github.com/istarryn/LLaCTR.

翻译：点击率（CTR）预测是现代推荐系统中的一项基础任务。近年来，大型语言模型（LLM）的集成已被证明能有效提升传统CTR方法的性能。然而，现有的LLM增强方法通常需要对大规模实例或用户/物品实体的详细文本描述进行大量处理，导致显著的计算开销。为应对这一挑战，本研究提出了LLaCTR，一种新颖且轻量级的LLM增强CTR方法，采用字段级增强范式。具体而言，LLaCTR首先利用LLM通过自监督的字段-特征微调，从小规模特征字段中提炼关键且轻量级的语义知识。随后，它利用这种字段级语义知识来增强特征表示和特征交互。在我们的实验中，我们在四个数据集上将LLaCTR与六种代表性CTR模型集成，证明了其在效果和效率方面均优于现有的LLM增强方法。我们的代码发布于https://github.com/istarryn/LLaCTR。

0

相关内容

CTR

【ICML2025】用于图神经网络的LLM增强方法：因果机制识别视角下的分析

【ICML2025】用于图神经网络的LLM增强方法：因果机制识别视角下的分析

专知会员服务

16+阅读 · 2025年5月14日

大规模语言模型增强推荐系统：分类、趋势、应用与未来

大规模语言模型增强推荐系统：分类、趋势、应用与未来

专知会员服务

40+阅读 · 2024年12月22日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

【大模型+仿射科学】LLM在放射科学中应用潜力如何？数十家研究机构联合测试了31个大模型

【大模型+仿射科学】LLM在放射科学中应用潜力如何？数十家研究机构联合测试了31个大模型

专知会员服务

24+阅读 · 2023年9月15日

大模型如何重塑推荐？香港理工大学等《大型语言模型（LLMs）时代的推荐系统》综述论文，全面阐述LLM+RS技术体系

大模型如何重塑推荐？香港理工大学等《大型语言模型（LLMs）时代的推荐系统》综述论文，全面阐述LLM+RS技术体系

专知会员服务

74+阅读 · 2023年9月3日

大模型如何重塑推荐？中科大等最新《面向推荐的大型语言模型》综述，全面阐述LLM4Rec进展

大模型如何重塑推荐？中科大等最新《面向推荐的大型语言模型》综述，全面阐述LLM4Rec进展

专知会员服务

93+阅读 · 2023年6月1日

【SIGIR2021】ScaleFreeCTR：超大规模Embedding推荐模型分布式训练系统

专知会员服务

28+阅读 · 2021年4月26日

【WSDM2021】多交互注意力网络细粒度特征学习的CTR预测

【WSDM2021】多交互注意力网络细粒度特征学习的CTR预测

专知会员服务

25+阅读 · 2020年12月27日

【NeurIPS 2020京东】基于卡尔曼滤波的注意力机制—广告点击率预估中的用户行为建模

专知会员服务

26+阅读 · 2020年10月30日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知会员服务

55+阅读 · 2020年3月17日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

经典！工业界深度推荐系统与CTR预估必读的论文汇总

经典！工业界深度推荐系统与CTR预估必读的论文汇总

AINLP

34+阅读 · 2019年9月23日

初学者系列：Deep FM详解

初学者系列：Deep FM详解

专知

110+阅读 · 2019年8月26日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

CTR预估专栏 | Facebook经典模型LR+GBDT理论与实践

CTR预估专栏 | Facebook经典模型LR+GBDT理论与实践

AI前线

14+阅读 · 2018年8月3日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

[推荐] 这些年，我用过的点击率（CTR）预估模型！！！

[推荐] 这些年，我用过的点击率（CTR）预估模型！！！

菜鸟的机器学习

28+阅读 · 2017年7月31日

基于光场测量的高清晰成像方法探索研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于散射点密度信息熵的层析SAR建筑三维重建新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于低辐射双能谱CT实现多种基础物质分解的重建算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于交联增强自组装策略构建高稳定性量子点荧光探针及其在肺癌miRNA标志物检测中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率计算的大规模MIMO检测方法

国家自然科学基金

1+阅读 · 2015年12月31日

近极限尺寸纳米结构的表面增强拉曼效应及其对红细胞携放氧能力的高通量检测

国家自然科学基金

0+阅读 · 2015年12月31日

全局性气动外形优化中的流场加速求解新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于增量式方法的大规模动态覆盖信息系统知识约简理论和应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

LLM-Confidence Reranker: A Training-Free Approach for Enhancing Retrieval-Augmented Generation Systems

Arxiv

0+阅读 · 2月14日

ProxyWar: Dynamic Assessment of LLM Code Generation in Game Arenas

Arxiv

0+阅读 · 2月4日

MiniRec: Data-Efficient Reinforcement Learning for LLM-based Recommendation

Arxiv

0+阅读 · 2月4日

Beyond the Prompt: Assessing Domain Knowledge Strategies for High-Dimensional LLM Optimization in Software Engineering

Arxiv

0+阅读 · 2月2日

Improving LLM-based Global Optimization with Search Space Partitioning

Arxiv

0+阅读 · 1月27日

Enhancing LLM-based Recommendation with Preference Hint Discovery from Knowledge Graph

Arxiv

0+阅读 · 1月26日

SPRINT: Scalable and Predictive Intent Refinement for LLM-Enhanced Session-based Recommendation

Arxiv

0+阅读 · 1月23日

TransMode-LLM: Feature-Informed Natural Language Modeling with Domain-Enhanced Prompting for Travel Behavior Modeling

Arxiv

0+阅读 · 1月20日

LLM-as-RNN: A Recurrent Language Model for Memory Updates and Sequence Prediction

Arxiv

0+阅读 · 1月19日

LLMs Meet Isolation Kernel: Lightweight, Learning-free Binary Embeddings for Fast Retrieval

Arxiv

0+阅读 · 1月17日

VIP会员

文章信息

相关主题

大语言模型

最新内容

2026“人工智能+”行业发展蓝皮书（附下载）

2026“人工智能+”行业发展蓝皮书（附下载）

专知会员服务

1+阅读 · 26分钟前

《强化学习数学基础》

《强化学习数学基础》

专知会员服务

1+阅读 · 30分钟前

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

专知会员服务

1+阅读 · 今天10:06

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

专知会员服务

1+阅读 · 今天9:11

深入Maven智能系统：Palantir基于Claude打造的军事大脑

深入Maven智能系统：Palantir基于Claude打造的军事大脑

专知会员服务

6+阅读 · 今天8:18

“Maven计划”的发展演变之“Maven智能系统”应用

“Maven计划”的发展演变之“Maven智能系统”应用

专知会员服务

4+阅读 · 今天8:03

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

专知会员服务

5+阅读 · 今天7:39

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

专知会员服务

4+阅读 · 今天6:58

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

专知会员服务

3+阅读 · 今天6:54

《无人机革命：来自俄乌战场的启示》（报告）

《无人机革命：来自俄乌战场的启示》（报告）

专知会员服务

5+阅读 · 今天6:48

《实现联合作战能力所需的技术》58页报告

《实现联合作战能力所需的技术》58页报告

专知会员服务

2+阅读 · 今天6:30

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

专知会员服务

5+阅读 · 今天6:22

以色列运用人工智能优化空袭警报系统

以色列运用人工智能优化空袭警报系统

专知会员服务

3+阅读 · 今天6:20

以色列在多条战线部署AI智能体

以色列在多条战线部署AI智能体

专知会员服务

4+阅读 · 今天6:12

《将形式化方法工具应用于电子战代码库（经验报告）》

《将形式化方法工具应用于电子战代码库（经验报告）》

专知会员服务

4+阅读 · 今天6:09

相关VIP内容

【ICML2025】用于图神经网络的LLM增强方法：因果机制识别视角下的分析

【ICML2025】用于图神经网络的LLM增强方法：因果机制识别视角下的分析

专知会员服务

16+阅读 · 2025年5月14日

大规模语言模型增强推荐系统：分类、趋势、应用与未来

大规模语言模型增强推荐系统：分类、趋势、应用与未来

专知会员服务

40+阅读 · 2024年12月22日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

【大模型+仿射科学】LLM在放射科学中应用潜力如何？数十家研究机构联合测试了31个大模型

【大模型+仿射科学】LLM在放射科学中应用潜力如何？数十家研究机构联合测试了31个大模型

专知会员服务

24+阅读 · 2023年9月15日

大模型如何重塑推荐？香港理工大学等《大型语言模型（LLMs）时代的推荐系统》综述论文，全面阐述LLM+RS技术体系

大模型如何重塑推荐？香港理工大学等《大型语言模型（LLMs）时代的推荐系统》综述论文，全面阐述LLM+RS技术体系

专知会员服务

74+阅读 · 2023年9月3日

大模型如何重塑推荐？中科大等最新《面向推荐的大型语言模型》综述，全面阐述LLM4Rec进展

大模型如何重塑推荐？中科大等最新《面向推荐的大型语言模型》综述，全面阐述LLM4Rec进展

专知会员服务

93+阅读 · 2023年6月1日

【SIGIR2021】ScaleFreeCTR：超大规模Embedding推荐模型分布式训练系统

专知会员服务

28+阅读 · 2021年4月26日

【WSDM2021】多交互注意力网络细粒度特征学习的CTR预测

【WSDM2021】多交互注意力网络细粒度特征学习的CTR预测

专知会员服务

25+阅读 · 2020年12月27日

【NeurIPS 2020京东】基于卡尔曼滤波的注意力机制—广告点击率预估中的用户行为建模

专知会员服务

26+阅读 · 2020年10月30日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知会员服务

55+阅读 · 2020年3月17日

热门VIP内容

开通专知VIP会员享更多权益服务

《强化学习数学基础》

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

2026“人工智能+”行业发展蓝皮书（附下载）

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

相关资讯

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

经典！工业界深度推荐系统与CTR预估必读的论文汇总

经典！工业界深度推荐系统与CTR预估必读的论文汇总

AINLP

34+阅读 · 2019年9月23日

初学者系列：Deep FM详解

初学者系列：Deep FM详解

专知

110+阅读 · 2019年8月26日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

CTR预估专栏 | Facebook经典模型LR+GBDT理论与实践

CTR预估专栏 | Facebook经典模型LR+GBDT理论与实践

AI前线

14+阅读 · 2018年8月3日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

[推荐] 这些年，我用过的点击率（CTR）预估模型！！！

[推荐] 这些年，我用过的点击率（CTR）预估模型！！！

菜鸟的机器学习

28+阅读 · 2017年7月31日

相关论文

LLM-Confidence Reranker: A Training-Free Approach for Enhancing Retrieval-Augmented Generation Systems

Arxiv

0+阅读 · 2月14日

ProxyWar: Dynamic Assessment of LLM Code Generation in Game Arenas

Arxiv

0+阅读 · 2月4日

MiniRec: Data-Efficient Reinforcement Learning for LLM-based Recommendation

Arxiv

0+阅读 · 2月4日

Beyond the Prompt: Assessing Domain Knowledge Strategies for High-Dimensional LLM Optimization in Software Engineering

Arxiv

0+阅读 · 2月2日

Improving LLM-based Global Optimization with Search Space Partitioning

Arxiv

0+阅读 · 1月27日

Enhancing LLM-based Recommendation with Preference Hint Discovery from Knowledge Graph

Arxiv

0+阅读 · 1月26日

SPRINT: Scalable and Predictive Intent Refinement for LLM-Enhanced Session-based Recommendation

Arxiv

0+阅读 · 1月23日

TransMode-LLM: Feature-Informed Natural Language Modeling with Domain-Enhanced Prompting for Travel Behavior Modeling

Arxiv

0+阅读 · 1月20日

LLM-as-RNN: A Recurrent Language Model for Memory Updates and Sequence Prediction

Arxiv

0+阅读 · 1月19日

LLMs Meet Isolation Kernel: Lightweight, Learning-free Binary Embeddings for Fast Retrieval

Arxiv

0+阅读 · 1月17日

相关基金

基于光场测量的高清晰成像方法探索研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于散射点密度信息熵的层析SAR建筑三维重建新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于低辐射双能谱CT实现多种基础物质分解的重建算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于交联增强自组装策略构建高稳定性量子点荧光探针及其在肺癌miRNA标志物检测中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率计算的大规模MIMO检测方法

国家自然科学基金

1+阅读 · 2015年12月31日

近极限尺寸纳米结构的表面增强拉曼效应及其对红细胞携放氧能力的高通量检测

国家自然科学基金

0+阅读 · 2015年12月31日

全局性气动外形优化中的流场加速求解新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于增量式方法的大规模动态覆盖信息系统知识约简理论和应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员