A Simple yet Effective Negative Sampling Plugin for Constructing Positive Sample Pairs in Implicit Collaborative Filtering - 专知论文

会员服务 ·

0

样本 · 负采样 · 协同 · 协同过滤 · 构建 ·

A Simple yet Effective Negative Sampling Plugin for Constructing Positive Sample Pairs in Implicit Collaborative Filtering

翻译：一种简单而有效的负采样插件：用于隐式协同过滤中构建正样本对

Jiayi Wu,Zhengyu Wu,Xunkai Li,Ronghua Li,Guoren Wang

Most implicit collaborative filtering (CF) models are trained with negative sampling, where existing work designs sophisticated strategies for high-quality negatives while largely overlooking the exploration of positive samples. Although some denoising recommendation methods can be applied to implicit CF for denoising positive samples, they often sparsify positive supervision. Moreover, these approaches generally overlook user activity bias during training, leading to insufficient learning for inactive users. To address these issues, we propose a simple yet effective negative sampling plugin, PSP-NS, from the perspective of enhancing positive supervision signals. It builds a user-item bipartite graph with edge weights indicating interaction confidence inferred from global and local patterns, generates positive sample pairs via replication-based reweighting to strengthen positive signals, and adopts an activity-aware weighting scheme to effectively learn inactive users' preferences. We provide theoretical insights from a margin-improvement perspective, explaining why PSP-NS tends to improve ranking quality (e.g., Precision@k/Recall@k), and conduct extensive experiments on four real-world datasets to demonstrate its superiority. For instance, PSP-NS boosts Recall@30 and Precision@30 by 32.11% and 22.90% on Yelp over the strongest baselines. PSP-NS can be integrated with various implicit CF recommenders or negative sampling methods to enhance their performance.

翻译：大多数隐式协同过滤（CF）模型采用负采样进行训练，现有工作设计了复杂的策略来获取高质量负样本，却很大程度上忽视了对正样本的探索。尽管一些去噪推荐方法可应用于隐式CF以对正样本去噪，但它们往往会稀疏化正监督信号。此外，这些方法通常在训练过程中忽略用户活跃度偏差，导致对非活跃用户的学习不足。为解决这些问题，我们从增强正监督信号的角度出发，提出了一种简单而有效的负采样插件PSP-NS。它构建了一个用户-物品二部图，其中边权重表示从全局和局部模式推断出的交互置信度；通过基于复制的重加权生成正样本对以强化正信号；并采用活动感知加权方案来有效学习非活跃用户的偏好。我们从边际改进的角度提供了理论分析，解释了为何PSP-NS倾向于提升排序质量（如Precision@k/Recall@k），并在四个真实世界数据集上进行了广泛实验以证明其优越性。例如，在Yelp数据集上，PSP-NS相较于最强基线将Recall@30和Precision@30分别提升了32.11%和22.90%。PSP-NS可与多种隐式CF推荐器或负采样方法集成以提升其性能。

0

相关内容

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

专知会员服务

48+阅读 · 2021年12月22日

【KDD 2021 】 MixGCF: 基于多层嵌入合成负例用于推荐

专知会员服务

13+阅读 · 2021年8月8日

【KDD2021】高效数据特定模型搜索的协同过滤

专知会员服务

15+阅读 · 2021年6月26日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知会员服务

40+阅读 · 2020年10月14日

最新《推荐系统中的对抗性机器学习:现状和挑战》2020综述论文，35页pdf

专知会员服务

91+阅读 · 2020年5月23日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

专知会员服务

63+阅读 · 2020年5月23日

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

专知会员服务

36+阅读 · 2020年3月19日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

【综述】图像去噪的深度学习:综述，36页pdf，Deep Learning on Image Denoising: An overview

【综述】图像去噪的深度学习:综述，36页pdf，Deep Learning on Image Denoising: An overview

专知会员服务

71+阅读 · 2019年12月31日

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

专知会员服务

40+阅读 · 2019年11月23日

浅析神经协同过滤NCF在推荐系统的应用

浅析神经协同过滤NCF在推荐系统的应用

凡人机器学习

15+阅读 · 2020年10月17日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知

13+阅读 · 2020年10月15日

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

THU数据派

10+阅读 · 2020年4月3日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

面试题：Word2Vec中为什么使用负采样？

面试题：Word2Vec中为什么使用负采样？

七月在线实验室

46+阅读 · 2019年5月16日

今晚20点大讲堂 | 知识图谱的嵌入：更好更快的负采样

今晚20点大讲堂 | 知识图谱的嵌入：更好更快的负采样

AI研习社

11+阅读 · 2019年3月7日

大讲堂 | 知识图谱的嵌入：更好更快的负采样

大讲堂 | 知识图谱的嵌入：更好更快的负采样

AI研习社

13+阅读 · 2019年3月6日

推荐系统BAT面试题：说说协同过滤的原理

推荐系统BAT面试题：说说协同过滤的原理

七月在线实验室

50+阅读 · 2019年1月30日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

深度学习探索

13+阅读 · 2017年7月16日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

负虚系统网络一致性算法及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于随机有限集理论的复杂背景视频多目标跟踪研究

国家自然科学基金

2+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Adaptive Moments are Surprisingly Effective for Plug-and-Play Diffusion Sampling

Arxiv

0+阅读 · 3月17日

Towards Reliable Negative Sampling for Recommendation with Implicit Feedback via In-Community Popularity

Arxiv

0+阅读 · 2月21日

A Topology-Aware Positive Sample Set Construction and Feature Optimization Method in Implicit Collaborative Filtering

Arxiv

0+阅读 · 2月20日

Dual-Tree LLM-Enhanced Negative Sampling for Implicit Collaborative Filtering

Arxiv

0+阅读 · 2月20日

Filter2Noise: A Framework for Interpretable and Zero-Shot Low-Dose CT Image Denoising

Arxiv

0+阅读 · 2月18日

Semantics-Aware Denoising: A PLM-Guided Sample Reweighting Strategy for Robust Recommendation

Arxiv

0+阅读 · 2月17日

Noisy-Pair Robust Representation Alignment for Positive-Unlabeled Learning

Arxiv

0+阅读 · 2月10日

Evaluating Sample Utility for Efficient Data Selection by Mimicking Model Weights

Arxiv

0+阅读 · 2月7日

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Arxiv

0+阅读 · 2月7日

Not All Negative Samples Are Equal: LLMs Learn Better from Plausible Reasoning

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

最新内容

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

10+阅读 · 今天6:39

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

3+阅读 · 今天6:36

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

8+阅读 · 今天6:28

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

5+阅读 · 今天0:51

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

4+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

7+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

6+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

6+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

10+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

12+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

8+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

20+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

12+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

相关VIP内容

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

当SVM碰上对比学习？霍普金斯/MIT学者在AAAI2022提出《最大化间隔对比学习》选择更好的负样例提升对比性能

专知会员服务

48+阅读 · 2021年12月22日

【KDD 2021 】 MixGCF: 基于多层嵌入合成负例用于推荐

专知会员服务

13+阅读 · 2021年8月8日

【KDD2021】高效数据特定模型搜索的协同过滤

专知会员服务

15+阅读 · 2021年6月26日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知会员服务

40+阅读 · 2020年10月14日

最新《推荐系统中的对抗性机器学习:现状和挑战》2020综述论文，35页pdf

专知会员服务

91+阅读 · 2020年5月23日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

专知会员服务

63+阅读 · 2020年5月23日

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

专知会员服务

36+阅读 · 2020年3月19日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

【综述】图像去噪的深度学习:综述，36页pdf，Deep Learning on Image Denoising: An overview

【综述】图像去噪的深度学习:综述，36页pdf，Deep Learning on Image Denoising: An overview

专知会员服务

71+阅读 · 2019年12月31日

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

专知会员服务

40+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能在全球军事与武器工业中的应用、方法论与影响》

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

相关资讯

浅析神经协同过滤NCF在推荐系统的应用

浅析神经协同过滤NCF在推荐系统的应用

凡人机器学习

15+阅读 · 2020年10月17日

【MIT】硬负样本的对比学习

【MIT】硬负样本的对比学习

专知

13+阅读 · 2020年10月15日

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

WWW2020|基于知识图谱的负采样模型在推荐系统中的应用(已开源)

THU数据派

10+阅读 · 2020年4月3日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

面试题：Word2Vec中为什么使用负采样？

面试题：Word2Vec中为什么使用负采样？

七月在线实验室

46+阅读 · 2019年5月16日

今晚20点大讲堂 | 知识图谱的嵌入：更好更快的负采样

今晚20点大讲堂 | 知识图谱的嵌入：更好更快的负采样

AI研习社

11+阅读 · 2019年3月7日

大讲堂 | 知识图谱的嵌入：更好更快的负采样

大讲堂 | 知识图谱的嵌入：更好更快的负采样

AI研习社

13+阅读 · 2019年3月6日

推荐系统BAT面试题：说说协同过滤的原理

推荐系统BAT面试题：说说协同过滤的原理

七月在线实验室

50+阅读 · 2019年1月30日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

推荐系统主要算法总结及Youtube深度学习推荐算法实例概括

深度学习探索

13+阅读 · 2017年7月16日

相关论文

Adaptive Moments are Surprisingly Effective for Plug-and-Play Diffusion Sampling

Arxiv

0+阅读 · 3月17日

Towards Reliable Negative Sampling for Recommendation with Implicit Feedback via In-Community Popularity

Arxiv

0+阅读 · 2月21日

A Topology-Aware Positive Sample Set Construction and Feature Optimization Method in Implicit Collaborative Filtering

Arxiv

0+阅读 · 2月20日

Dual-Tree LLM-Enhanced Negative Sampling for Implicit Collaborative Filtering

Arxiv

0+阅读 · 2月20日

Filter2Noise: A Framework for Interpretable and Zero-Shot Low-Dose CT Image Denoising

Arxiv

0+阅读 · 2月18日

Semantics-Aware Denoising: A PLM-Guided Sample Reweighting Strategy for Robust Recommendation

Arxiv

0+阅读 · 2月17日

Noisy-Pair Robust Representation Alignment for Positive-Unlabeled Learning

Arxiv

0+阅读 · 2月10日

Evaluating Sample Utility for Efficient Data Selection by Mimicking Model Weights

Arxiv

0+阅读 · 2月7日

OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

Arxiv

0+阅读 · 2月7日

Not All Negative Samples Are Equal: LLMs Learn Better from Plausible Reasoning

Arxiv

0+阅读 · 2月3日

相关基金

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

负虚系统网络一致性算法及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于迁移学习的图像隐写分析新方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于随机有限集理论的复杂背景视频多目标跟踪研究

国家自然科学基金

2+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员