Diversification is a useful tool for exploring large collections of information items. It has been used to reduce redundancy and cover multiple perspectives in information-search settings. Diversification finds applications in many different domains, including presenting search results of information-retrieval systems and selecting suggestions for recommender systems. Interestingly, existing measures of diversity are defined over \emph{sets} of items, rather than evaluating \emph{sequences} of items. This design choice comes in contrast with commonly-used relevance measures, which are distinctly defined over sequences of items, taking into account the ranking of items. The importance of employing sequential measures is that information items are almost always presented in a sequential manner, and during their information-exploration activity users tend to prioritize items with higher~ranking. In this paper, we study the problem of \emph{maximizing sequential diversity}. This is a new measure of \emph{diversity}, which accounts for the \emph{ranking} of the items, and incorporates \emph{item relevance} and \emph{user behavior}. The overarching framework can be instantiated with different diversity measures, and here we consider the measures of \emph{sum~diversity} and \emph{coverage~diversity}. The problem was recently proposed by Coppolillo et al.~\citep{coppolillo2024relevance}, where they introduce empirical methods that work well in practice. Our paper is a theoretical treatment of the problem: we establish the problem hardness and present algorithms with constant approximation guarantees for both diversity measures we consider. Experimentally, we demonstrate that our methods are competitive against strong baselines.


翻译:多样化是探索大规模信息集合的有用工具。它已被用于减少冗余并在信息检索场景中覆盖多重视角。多样化在众多不同领域均有应用,包括呈现信息检索系统的搜索结果以及为推荐系统选择建议。有趣的是,现有的多样性度量是针对项目的\emph{集合}而非项目的\emph{序列}进行定义的。这一设计选择与常用的相关性度量形成对比,后者明确针对项目序列进行定义,并考虑了项目的排序。采用序列度量的重要性在于,信息项目几乎总是以序列方式呈现,并且在用户的信息探索活动中,他们倾向于优先关注排名更高的项目。在本文中,我们研究\emph{最大化序列多样性}的问题。这是一种新的\emph{多样性}度量,它考虑了项目的\emph{排序},并融合了\emph{项目相关性}和\emph{用户行为}。该总体框架可以通过不同的多样性度量进行实例化,本文我们考虑\emph{和多样性}与\emph{覆盖多样性}这两种度量。该问题最近由Coppolillo等人~\citep{coppolillo2024relevance}提出,他们引入了在实践中表现良好的经验方法。本文是对该问题的理论处理:我们确立了问题的计算难度,并针对所考虑的两种多样性度量提出了具有常数近似保证的算法。实验表明,我们的方法与强大的基线方法相比具有竞争力。

0
下载
关闭预览

相关内容

数学上,序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。
多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
《序列推荐》最新综述
专知会员服务
22+阅读 · 2024年12月27日
多模态复合编辑与检索综述
专知会员服务
25+阅读 · 2024年9月14日
专知会员服务
37+阅读 · 2021年4月18日
【CIKM2020】利用自注意力网络使搜索结果多样化
专知会员服务
13+阅读 · 2020年11月6日
数据受限条件下的多模态处理技术综述
专知
22+阅读 · 2022年7月16日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
搜索query意图识别的演进
DataFunTalk
13+阅读 · 2020年11月15日
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
标签间相关性在多标签分类问题中的应用
人工智能前沿讲习班
23+阅读 · 2019年6月5日
非平衡数据集 focal loss 多类分类
AI研习社
33+阅读 · 2019年4月23日
新书推荐《推荐系统进展:方法与技术》
LibRec智能推荐
13+阅读 · 2019年3月18日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
这可能是「多模态机器学习」最通俗易懂的介绍
计算机视觉life
113+阅读 · 2018年12月20日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月17日
VIP会员
相关VIP内容
多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
《序列推荐》最新综述
专知会员服务
22+阅读 · 2024年12月27日
多模态复合编辑与检索综述
专知会员服务
25+阅读 · 2024年9月14日
专知会员服务
37+阅读 · 2021年4月18日
【CIKM2020】利用自注意力网络使搜索结果多样化
专知会员服务
13+阅读 · 2020年11月6日
相关资讯
数据受限条件下的多模态处理技术综述
专知
22+阅读 · 2022年7月16日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
搜索query意图识别的演进
DataFunTalk
13+阅读 · 2020年11月15日
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
标签间相关性在多标签分类问题中的应用
人工智能前沿讲习班
23+阅读 · 2019年6月5日
非平衡数据集 focal loss 多类分类
AI研习社
33+阅读 · 2019年4月23日
新书推荐《推荐系统进展:方法与技术》
LibRec智能推荐
13+阅读 · 2019年3月18日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
这可能是「多模态机器学习」最通俗易懂的介绍
计算机视觉life
113+阅读 · 2018年12月20日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员