ChatGPT has emerged as a versatile tool, demonstrating capabilities across diverse domains. Given these successes, the Recommender Systems (RSs) community has begun investigating its applications within recommendation scenarios primarily focusing on accuracy. While the integration of ChatGPT into RSs has garnered significant attention, a comprehensive analysis of its performance across various dimensions remains largely unexplored. Specifically, the capabilities of providing diverse and novel recommendations or exploring potential biases such as popularity bias have not been thoroughly examined. As the use of these models continues to expand, understanding these aspects is crucial for enhancing user satisfaction and achieving long-term personalization. This study investigates the recommendations provided by ChatGPT-3.5 and ChatGPT-4 by assessing ChatGPT's capabilities in terms of diversity, novelty, and popularity bias. We evaluate these models on three distinct datasets and assess their performance in Top-N recommendation and cold-start scenarios. The findings reveal that ChatGPT-4 matches or surpasses traditional recommenders, demonstrating the ability to balance novelty and diversity in recommendations. Furthermore, in the cold-start scenario, ChatGPT models exhibit superior performance in both accuracy and novelty, suggesting they can be particularly beneficial for new users. This research highlights the strengths and limitations of ChatGPT's recommendations, offering new perspectives on the capacity of these models to provide recommendations beyond accuracy-focused metrics.


翻译:ChatGPT已成为一种多功能工具,在多个领域展现出卓越能力。鉴于这些成功,推荐系统(RSs)研究社区已开始探索其在推荐场景中的应用,主要聚焦于准确性指标。尽管ChatGPT与推荐系统的融合已引起广泛关注,但其在多维度性能上的综合分析仍属空白。具体而言,该模型在提供多样化与新颖推荐方面的能力,以及探索潜在偏差(如流行度偏差)的可能性尚未得到系统检验。随着此类模型应用的持续扩展,理解这些特性对于提升用户满意度与实现长期个性化至关重要。本研究通过评估ChatGPT-3.5与ChatGPT-4在多样性、新颖性及流行度偏差方面的表现,系统考察其推荐特性。我们在三个独立数据集上对这些模型进行测试,并评估其在Top-N推荐与冷启动场景中的性能。研究结果表明,ChatGPT-4达到或超越了传统推荐系统的水平,展现出平衡推荐新颖性与多样性的能力。此外,在冷启动场景中,ChatGPT模型在准确性与新颖性方面均表现优异,表明其对新用户具有特殊价值。本研究揭示了ChatGPT推荐的优势与局限,为理解此类模型超越准确性指标的推荐能力提供了新视角。

0
下载
关闭预览

相关内容

ChatGPT在军事中的潜在角色:根据ChatGPT的观点
专知会员服务
35+阅读 · 2025年1月1日
ChatGPT在网络安全领域的应用、现状与趋势
专知会员服务
73+阅读 · 2023年7月16日
浅析ChatGPT: 历史沿革、应用现状及前景展望
专知会员服务
90+阅读 · 2023年5月3日
【ChatGPT系列报告】ChatGPT引领AI突破,工业AI前景可期
专知会员服务
96+阅读 · 2023年4月7日
【ChatGPT系列报告】ChatGPT不断突破,AI驶入快车道
专知会员服务
136+阅读 · 2023年2月23日
AIGC行业深度报告:ChatGPT:重新定义搜索“入口”
专知会员服务
138+阅读 · 2023年2月10日
最新《ChatGPT》报告, 风口已至,商业化落地加速, 14页pdf
新书推荐《推荐系统进展:方法与技术》
LibRec智能推荐
13+阅读 · 2019年3月18日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
深度学习在推荐系统上的应用
架构文摘
13+阅读 · 2018年2月22日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
175+阅读 · 2023年4月20日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员