Hard Negative Sampling via Large Language Models for Recommendation - 专知论文

会员服务 ·

0

负样本 · 样本 · 语言模型 · 系统 · 监督 ·

Hard Negative Sampling via Large Language Models for Recommendation

翻译：基于大语言模型的推荐系统难负样本采样方法

Chu Zhao,Enneng Yang,Yuting Liu,Jianzhe Zhao,Guibing Guo

from arxiv, 19 pages

Hard negative sampling improves recommendation performance by accelerating convergence and sharpening the decision boundary. However, most existing methods rely on heuristic strategies, selecting negatives from a fixed candidate pool. Lacking semantic awareness, these methods often misclassify items that align with users' semantic interests as negatives, resulting in False Hard Negative Samples (FHNS). Such FHNS inject noisy supervision and hinder the model's optimal performance. To address this challenge, we propose HNLMRec, a generative semantic negative sampling framework. Leveraging the semantic reasoning capabilities of Large Language Models (LLMs), HNLMRec directly generates negative samples that are behaviorally distinct yet semantically relevant with respect to user preferences. Furthermore, we integrate collaborative filtering signals into the LLM via supervised fine-tuning, guiding the model to synthesize more reliable and informative hard negatives. Extensive experiments on multiple real-world datasets demonstrate that HNLMRec significantly outperforms traditional methods and LLM-enhanced baselines, while effectively mitigating popularity bias and data sparsity, thereby improving generalization.

翻译：难负样本采样通过加速收敛和锐化决策边界来提升推荐性能。然而，现有方法大多依赖启发式策略，从固定候选池中选取负样本。由于缺乏语义感知能力，这些方法常将与用户语义兴趣相符的物品误判为负样本，导致产生伪难负样本。此类伪难负样本会引入噪声监督，阻碍模型达到最优性能。为应对这一挑战，我们提出HNLMRec——一种生成式语义负采样框架。该框架利用大语言模型的语义推理能力，直接生成在行为模式上相异但与用户偏好语义相关的负样本。此外，我们通过监督微调将协同过滤信号融入大语言模型，引导其合成更可靠且信息量更大的难负样本。在多个真实数据集上的大量实验表明，HNLMRec显著优于传统方法及大语言模型增强基线，同时有效缓解流行度偏差与数据稀疏性问题，从而提升模型的泛化能力。

0

相关内容

负样本

大语言模型在多模态推荐系统中的应用综述

大语言模型在多模态推荐系统中的应用综述

专知会员服务

17+阅读 · 2025年5月17日

【WWW2025】G-Refer：基于图检索增强的大型语言模型用于可解释推荐

【WWW2025】G-Refer：基于图检索增强的大型语言模型用于可解释推荐

专知会员服务

13+阅读 · 2025年4月8日

【WWW2025】释放大型语言模型在去噪推荐中的强大能力

【WWW2025】释放大型语言模型在去噪推荐中的强大能力

专知会员服务

13+阅读 · 2025年2月18日

关于大语言模型驱动的推荐系统智能体的综述

关于大语言模型驱动的推荐系统智能体的综述

专知会员服务

29+阅读 · 2025年2月17日

大规模语言模型增强推荐系统：分类、趋势、应用与未来

大规模语言模型增强推荐系统：分类、趋势、应用与未来

专知会员服务

40+阅读 · 2024年12月22日

大语言模型在序列推荐中的应用

大语言模型在序列推荐中的应用

专知会员服务

19+阅读 · 2024年11月12日

推荐系统与大语言模型技术融合：EMNLP/NeurIPS相关论文导览

推荐系统与大语言模型技术融合：EMNLP/NeurIPS相关论文导览

专知会员服务

13+阅读 · 2024年10月14日

【IJCAI2024教程】大语言模型（LLMs）时代的推荐系统

【IJCAI2024教程】大语言模型（LLMs）时代的推荐系统

专知会员服务

51+阅读 · 2024年8月5日

哈工大最新《自然语言处理数据增强方法》综述论文，155页pdf阐述复述、噪声和抽样三大数据增强方法

专知会员服务

48+阅读 · 2021年10月16日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知

13+阅读 · 2020年10月15日

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

THU数据派

10+阅读 · 2020年4月3日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

面试题：Word2Vec中为什么使用负采样？

面试题：Word2Vec中为什么使用负采样？

七月在线实验室

46+阅读 · 2019年5月16日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

推荐系统算法合集，满满都是干货（建议收藏）

推荐系统算法合集，满满都是干货（建议收藏）

七月在线实验室

17+阅读 · 2018年7月23日

深度学习在推荐系统中的应用综述（最全）

深度学习在推荐系统中的应用综述（最全）

七月在线实验室

17+阅读 · 2018年5月5日

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

深度学习探索

13+阅读 · 2017年7月16日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

大数据环境下稀有类数据挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

大数据环境下融合多源信息的推荐系统关键问题研究

国家自然科学基金

6+阅读 · 2014年12月31日

Not All Negative Samples Are Equal: LLMs Learn Better from Plausible Reasoning

Arxiv

0+阅读 · 2月3日

Towards Fair Large Language Model-based Recommender Systems without Costly Retraining

Arxiv

0+阅读 · 2月1日

Uncertainty and Fairness Awareness in LLM-Based Recommendation Systems

Arxiv

0+阅读 · 1月31日

Towards Sample-Efficient and Stable Reinforcement Learning for LLM-based Recommendation

Arxiv

0+阅读 · 1月31日

Diversity-Augmented Negative Sampling for Implicit Collaborative Filtering

Arxiv

0+阅读 · 1月27日

Towards Fair Large Language Model-based Recommender Systems without Costly Retraining

Arxiv

0+阅读 · 1月24日

Efficient semantic uncertainty quantification in language models via diversity-steered sampling

Arxiv

0+阅读 · 1月23日

CoNRec: Context-Discerning Negative Recommendation with LLMs

Arxiv

0+阅读 · 1月22日

Bridging Semantic Understanding and Popularity Bias with LLMs

Arxiv

0+阅读 · 1月18日

Integrating Large Language Models into Recommendation via Mutual Augmentation and Adaptive Aggregation

Arxiv

0+阅读 · 1月18日

VIP会员

文章信息

相关主题

最新内容

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

4+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

3+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

3+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

2+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

5+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

3+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

5+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

18+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

9+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

10+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

9+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

14+阅读 · 5月29日

相关VIP内容

大语言模型在多模态推荐系统中的应用综述

大语言模型在多模态推荐系统中的应用综述

专知会员服务

17+阅读 · 2025年5月17日

【WWW2025】G-Refer：基于图检索增强的大型语言模型用于可解释推荐

【WWW2025】G-Refer：基于图检索增强的大型语言模型用于可解释推荐

专知会员服务

13+阅读 · 2025年4月8日

【WWW2025】释放大型语言模型在去噪推荐中的强大能力

【WWW2025】释放大型语言模型在去噪推荐中的强大能力

专知会员服务

13+阅读 · 2025年2月18日

关于大语言模型驱动的推荐系统智能体的综述

关于大语言模型驱动的推荐系统智能体的综述

专知会员服务

29+阅读 · 2025年2月17日

大规模语言模型增强推荐系统：分类、趋势、应用与未来

大规模语言模型增强推荐系统：分类、趋势、应用与未来

专知会员服务

40+阅读 · 2024年12月22日

大语言模型在序列推荐中的应用

大语言模型在序列推荐中的应用

专知会员服务

19+阅读 · 2024年11月12日

推荐系统与大语言模型技术融合：EMNLP/NeurIPS相关论文导览

推荐系统与大语言模型技术融合：EMNLP/NeurIPS相关论文导览

专知会员服务

13+阅读 · 2024年10月14日

【IJCAI2024教程】大语言模型（LLMs）时代的推荐系统

【IJCAI2024教程】大语言模型（LLMs）时代的推荐系统

专知会员服务

51+阅读 · 2024年8月5日

哈工大最新《自然语言处理数据增强方法》综述论文，155页pdf阐述复述、噪声和抽样三大数据增强方法

专知会员服务

48+阅读 · 2021年10月16日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

热门VIP内容

开通专知VIP会员享更多权益服务

比利时发布用于实时战场军事装备识别的离线人工智能系统

超越网格：作战环境对炮兵的影响

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

相关资讯

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知

13+阅读 · 2020年10月15日

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

THU数据派

10+阅读 · 2020年4月3日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

面试题：Word2Vec中为什么使用负采样？

面试题：Word2Vec中为什么使用负采样？

七月在线实验室

46+阅读 · 2019年5月16日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

推荐系统算法合集，满满都是干货（建议收藏）

推荐系统算法合集，满满都是干货（建议收藏）

七月在线实验室

17+阅读 · 2018年7月23日

深度学习在推荐系统中的应用综述（最全）

深度学习在推荐系统中的应用综述（最全）

七月在线实验室

17+阅读 · 2018年5月5日

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

深度学习探索

13+阅读 · 2017年7月16日

相关论文

Not All Negative Samples Are Equal: LLMs Learn Better from Plausible Reasoning

Arxiv

0+阅读 · 2月3日

Towards Fair Large Language Model-based Recommender Systems without Costly Retraining

Arxiv

0+阅读 · 2月1日

Uncertainty and Fairness Awareness in LLM-Based Recommendation Systems

Arxiv

0+阅读 · 1月31日

Towards Sample-Efficient and Stable Reinforcement Learning for LLM-based Recommendation

Arxiv

0+阅读 · 1月31日

Diversity-Augmented Negative Sampling for Implicit Collaborative Filtering

Arxiv

0+阅读 · 1月27日

Towards Fair Large Language Model-based Recommender Systems without Costly Retraining

Arxiv

0+阅读 · 1月24日

Efficient semantic uncertainty quantification in language models via diversity-steered sampling

Arxiv

0+阅读 · 1月23日

CoNRec: Context-Discerning Negative Recommendation with LLMs

Arxiv

0+阅读 · 1月22日

Bridging Semantic Understanding and Popularity Bias with LLMs

Arxiv

0+阅读 · 1月18日

Integrating Large Language Models into Recommendation via Mutual Augmentation and Adaptive Aggregation

Arxiv

0+阅读 · 1月18日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

大数据环境下稀有类数据挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

大数据环境下融合多源信息的推荐系统关键问题研究

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员