The typical offline protocol to evaluate recommendation algorithms is to collect a dataset of user-item interactions and then use a part of this dataset to train a model, and the remaining data to measure how closely the model recommendations match the observed user interactions. This protocol is straightforward, useful and practical, but it only provides snapshot performance. We know, however, that online systems evolve over time. In general, it is a good idea that models are frequently retrained with recent data. But if this is the case, to what extent can we trust previous evaluations? How will a model perform when a different pattern (re)emerges? In this paper we propose a methodology to study how recommendation models behave when they are retrained. The idea is to profile algorithms according to their ability to, on the one hand, retain past patterns - stability - and, on the other hand, (quickly) adapt to changes - plasticity. We devise an offline evaluation protocol that provides detail on the long-term behavior of models, and that is agnostic to datasets, algorithms and metrics. To illustrate the potential of this framework, we present preliminary results of three different types of algorithms on the GoodReads dataset that suggest different stability and plasticity profiles depending on the algorithmic technique, and a possible trade-off between stability and plasticity. We further discuss the potential and limitations of the proposal and advance some possible improvements.


翻译:推荐算法的典型离线评估协议是:收集用户-项目交互数据集,利用其中部分数据训练模型,再用剩余数据衡量模型推荐结果与观测用户交互的匹配程度。该协议虽然直接、实用且有效,但仅能提供瞬时性能指标。然而我们知道,在线系统会随时间推移不断演化。通常建议使用最新数据对模型进行频繁重训练,但若如此,先前评估结果的可信度又当如何?当不同模式(重新)出现时模型将如何表现?本文提出了一种研究推荐模型重训练行为的方法论,通过评估算法保留历史模式的能力(稳定性)与快速适应变化的能力(可塑性)来构建算法轮廓。我们设计了一种与数据集、算法和评估指标无关的离线评估协议,可揭示模型的长期行为特征。为展示该框架的潜力,我们在GoodReads数据集上对三类不同算法进行了初步实验,结果表明不同算法技术会呈现差异化的稳定性-可塑性特征,且两者间可能存在权衡关系。最后,我们讨论了该方法的潜力与局限性,并提出了若干改进方向。

0
下载
关闭预览

相关内容

在数学和计算机科学之中,算法(Algorithm)为一个计算的具体步骤,常用于计算、数据处理和自动推理。精确而言,算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。 来自维基百科: 算法
多模态推荐系统综述:近期进展与未来方向
专知会员服务
38+阅读 · 2025年2月27日
基于因果推断的推荐系统去偏研究
专知会员服务
21+阅读 · 2024年11月10日
「基于联邦学习的推荐系统」最新2022研究综述
专知会员服务
75+阅读 · 2022年5月21日
对话推荐算法研究综述
专知会员服务
50+阅读 · 2022年2月18日
个性化推荐系统技术进展
专知会员服务
66+阅读 · 2020年8月15日
推荐系统产品与算法概述 | 深度
AI100
11+阅读 · 2019年6月13日
新书推荐《推荐系统进展:方法与技术》
LibRec智能推荐
13+阅读 · 2019年3月18日
深度 | 推荐系统评估
AI100
24+阅读 · 2019年3月16日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
2+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
6+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 6月17日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员