Conversational search systems increasingly employ clarifying questions to refine user queries and improve the search experience. Previous studies have demonstrated the usefulness of text-based clarifying questions in enhancing both retrieval performance and user experience. While images have been shown to improve retrieval performance in various contexts, their impact on user performance when incorporated into clarifying questions remains largely unexplored. We conduct a user study with 73 participants to investigate the role of images in conversational search, specifically examining their effects on two search-related tasks: (i) answering clarifying questions and (ii) query reformulation. We compare the effect of multimodal and text-only clarifying questions in both tasks within a conversational search context from various perspectives. Our findings reveal that while participants showed a strong preference for multimodal questions when answering clarifying questions, preferences were more balanced in the query reformulation task. The impact of images varied with both task type and user expertise. In answering clarifying questions, images helped maintain engagement across different expertise levels, while in query reformulation they led to more precise queries and improved retrieval performance. Interestingly, for clarifying question answering, text-only setups demonstrated better user performance as they provided more comprehensive textual information in the absence of images. These results provide valuable insights for designing effective multimodal conversational search systems, highlighting that the benefits of visual augmentation are task-dependent and should be strategically implemented based on the specific search context and user characteristics.


翻译:会话搜索系统越来越多地采用澄清问题来优化用户查询并提升搜索体验。先前研究已证明基于文本的澄清问题在提升检索性能和用户体验方面的有效性。尽管图像已被证实在多种情境下能够改善检索性能,但将其融入澄清问题后对用户表现的影响仍鲜有研究。我们通过73名参与者开展用户研究,探究图像在会话搜索中的作用,重点考察其对两项搜索相关任务的影响:(i) 回答澄清问题与(ii)查询重构。我们从多维度比较了会话搜索情境下多模态与纯文本澄清问题对这两类任务的影响。研究发现:参与者在回答澄清问题时表现出对多模态问题的强烈偏好,但在查询重构任务中偏好更为均衡。图像的影响随任务类型和用户专业水平呈现差异。在回答澄清问题时,图像有助于维持不同专业水平用户的参与度;而在查询重构中,图像能促成更精确的查询并提升检索性能。值得注意的是,对于澄清问题回答任务,纯文本设置因在没有图像时提供了更全面的文本信息,反而展现出更优的用户表现。这些结果为设计高效的多模态会话搜索系统提供了重要启示:视觉增强的效益具有任务依赖性,应根据具体搜索情境和用户特征进行策略性部署。

0
下载
关闭预览

相关内容

互联网
图像去模糊研究综述
专知会员服务
21+阅读 · 2024年5月13日
图像修复研究进展综述
专知
20+阅读 · 2021年3月9日
搜索query意图识别的演进
DataFunTalk
13+阅读 · 2020年11月15日
专家报告 | 给“深度”以“先验”,让你的模糊图像清晰起来!
Query 理解和语义召回在知乎搜索中的应用
DataFunTalk
25+阅读 · 2020年1月2日
【教程】如何使用深度学习为照片自动生成文本描述?
GAN生成式对抗网络
20+阅读 · 2017年11月19日
知识图谱 vs. 对话系统专题讨论 - PaperWeekly 社区
PaperWeekly
10+阅读 · 2017年10月18日
基于图片内容的深度学习图片检索(一)
七月在线实验室
20+阅读 · 2017年10月1日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月16日
VIP会员
相关VIP内容
图像去模糊研究综述
专知会员服务
21+阅读 · 2024年5月13日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员