论文概述:尽管向量检索(Dense Retrieval)已经取得了不错的排序性能,之前的相关研究通常采用暴力搜索。在实际的网页搜索场景中,暴力搜索会带来大量存储和时间开销,因此几乎是无法接受的。为了解决这样的问题,我们提出JPQ。JPQ使用乘积量化(Product Quantization)来压缩存储并提升检索速度。为了保证检索性能不因为量化而损失,JPQ端到端地联合优化查询编码器和乘积量化的参数。我们在两个公开的大规模检索数据集上评测JPQ。实验结果表明,在不同设置下,JPQ都显著优于现有的向量压缩方法。与之前使用暴力搜索的向量检索模型相比,JPQ几乎不会影响排序性能,并且把索引大小压缩了30倍,提高了10倍的CPU检索速度和2倍的GPU检索速度。

https://www.zhuanzhi.ai/paper/51bd03ce5ed783b843f6c5077dd28527

成为VIP会员查看完整内容
9

相关内容

专知会员服务
9+阅读 · 2021年9月22日
专知会员服务
17+阅读 · 2021年9月18日
专知会员服务
16+阅读 · 2021年8月13日
专知会员服务
7+阅读 · 2021年8月7日
专知会员服务
27+阅读 · 2021年4月22日
专知会员服务
12+阅读 · 2021年3月25日
【知乎】超越Lexical:用于文本搜索引擎的语义检索框架
专知会员服务
22+阅读 · 2020年8月28日
【SIGIR2021】使用难样本优化向量检索模型
专知
5+阅读 · 2021年4月22日
基于二进制哈希编码快速学习的快速图像检索
炼数成金订阅号
8+阅读 · 2018年5月17日
优化哈希策略
ImportNew
5+阅读 · 2018年1月17日
用线性规划去计算句子之间的相似度
AI研习社
9+阅读 · 2017年12月27日
Identity-aware Graph Neural Networks
Arxiv
14+阅读 · 2021年1月25日
Arxiv
7+阅读 · 2018年1月10日
VIP会员
最新内容
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
1+阅读 · 今天15:53
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
1+阅读 · 今天15:04
马赛克防御与分布式指挥:伊朗的回击(中文版)
《基于理论的威慑效能评估》
专知会员服务
3+阅读 · 今天14:48
ICML2026 | 重新思考顺序知识编辑中的正则化
专知会员服务
7+阅读 · 5月27日
《用于兵力发展选项优先排序的成本效益模型》
专知会员服务
11+阅读 · 5月27日
AutoResearch AI综述:迈向AI驱动的科学发现自动化
专知会员服务
10+阅读 · 5月26日
《Palantir边缘人工智能》手册
专知会员服务
25+阅读 · 5月26日
相关VIP内容
专知会员服务
9+阅读 · 2021年9月22日
专知会员服务
17+阅读 · 2021年9月18日
专知会员服务
16+阅读 · 2021年8月13日
专知会员服务
7+阅读 · 2021年8月7日
专知会员服务
27+阅读 · 2021年4月22日
专知会员服务
12+阅读 · 2021年3月25日
【知乎】超越Lexical:用于文本搜索引擎的语义检索框架
专知会员服务
22+阅读 · 2020年8月28日
微信扫码咨询专知VIP会员