We focus on the task of retrieving nail design images based on dense intent descriptions, which represent multi-layered user intent for nail designs. This is challenging because such descriptions specify unconstrained painted elements and pre-manufactured embellishments as well as visual characteristics, themes, and overall impressions. In addition to these descriptions, we assume that users provide palette queries by specifying zero or more colors via a color picker, enabling the expression of subtle and continuous color nuances. Existing vision-language foundation models often struggle to incorporate such descriptions and palettes. To address this, we propose NaiLIA, a multimodal retrieval method for nail design images, which comprehensively aligns with dense intent descriptions and palette queries during retrieval. Our approach introduces a relaxed loss based on confidence scores for unlabeled images that can align with the descriptions. To evaluate NaiLIA, we constructed a benchmark consisting of 10,625 images collected from people with diverse cultural backgrounds. The images were annotated with long and dense intent descriptions given by over 200 annotators. Experimental results demonstrate that NaiLIA outperforms standard methods.


翻译:本研究聚焦于基于密集意图描述的美甲设计图像检索任务,此类描述表征了用户对美甲设计的多层次意图。该任务具有挑战性,因为此类描述不仅限定了无约束的手绘元素与预制装饰物,还涵盖了视觉特征、主题风格及整体观感。除文字描述外,我们假设用户通过颜色选择器指定零至多种颜色构成调色板查询,从而实现对细微连续色彩差异的表达。现有的视觉-语言基础模型往往难以有效融合此类描述与调色板信息。为此,我们提出NaiLIA——一种面向美甲设计图像的多模态检索方法,能够在检索过程中全面对齐密集意图描述与调色板查询。本方法引入基于未标注图像置信度的松弛损失函数,使其能够与描述信息对齐。为评估NaiLIA,我们构建了包含10,625张图像的基准数据集,这些图像采集自多元文化背景的人群,并由超过200名标注者提供了长文本密集意图描述。实验结果表明,NaiLIA在性能上优于现有标准方法。

0
下载
关闭预览

相关内容

设计是对现有状的一种重新认识和打破重组的过程,设计让一切变得更美。
《基于图像的虚拟试穿》综述
专知会员服务
22+阅读 · 2023年11月10日
《军事指定兴趣区(NAI)的开发流程》中文版
专知会员服务
31+阅读 · 2023年7月4日
专家报告 | 个性化图像美学评价
中国图象图形学报
14+阅读 · 2020年7月15日
综述:Image Caption 任务之语句多样性
PaperWeekly
22+阅读 · 2018年11月30日
图像美学质量评价技术发展趋势
科技导报
19+阅读 · 2018年6月25日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
2026“人工智能+”行业发展蓝皮书(附下载)
专知会员服务
5+阅读 · 今天12:11
《强化学习数学基础》
专知会员服务
3+阅读 · 今天12:07
“Maven计划”的发展演变之“Maven智能系统”应用
《无人机革命:来自俄乌战场的启示》(报告)
专知会员服务
7+阅读 · 今天6:48
《实现联合作战能力所需的技术》58页报告
专知会员服务
4+阅读 · 今天6:30
以色列运用人工智能优化空袭警报系统
专知会员服务
4+阅读 · 今天6:20
以色列在多条战线部署AI智能体
专知会员服务
5+阅读 · 今天6:12
相关VIP内容
《基于图像的虚拟试穿》综述
专知会员服务
22+阅读 · 2023年11月10日
《军事指定兴趣区(NAI)的开发流程》中文版
专知会员服务
31+阅读 · 2023年7月4日
相关资讯
专家报告 | 个性化图像美学评价
中国图象图形学报
14+阅读 · 2020年7月15日
综述:Image Caption 任务之语句多样性
PaperWeekly
22+阅读 · 2018年11月30日
图像美学质量评价技术发展趋势
科技导报
19+阅读 · 2018年6月25日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员