Fixed-cardinality retrieval injects a constant top-K chunks into the generator regardless of query complexity, causing over-retrieval for narrow queries and under-retrieval for compositional ones. We describe ScoreGate, a lightweight score-space decision mechanism that controls retrieval cardinality at inference time using two scores already produced by the standard pipeline: bi-encoder similarity s_i and cross-encoder reranker score r_i, with no additional model inference calls required. Its core insight is that cross-encoder affirmation can rescue semantically relevant chunks that bi-encoder retrieval ranks poorly due to vocabulary mismatch -- a failure mode unaddressed by fixed-K or single-score thresholding. On MS MARCO (200 dev queries), ScoreGate achieves MRR@10 = 0.401 with 35% fewer retained chunks than Standard Top-K. On an internal benchmark (n=300, Fleiss' kappa=0.87), ScoreGate observed zero false positives (95% CI [96.4%, 100%]) at 97.77-99.34% recall, with 34.8% fewer tokens per query and only 31ms added latency. Results on both MS MARCO and real-world production traffic suggest that adaptive retrieval cardinality can improve retrieval efficiency without degrading retrieval quality.


翻译:固定基数检索无论查询复杂度如何,均向生成器注入恒定数量的top-K分块,导致窄域查询出现过检索、复合查询出现欠检索问题。本文提出ScoreGate——一种轻量级分数空间决策机制,利用标准流程已生成的双编码器相似度s_i与交叉编码器重排序分数r_i,在推理阶段控制检索基数,无需额外模型推理调用。其核心洞见在于:交叉编码器的确认机制可挽救因词汇不匹配而被双编码器检索排名低但语义相关的分块——这是固定K值或单分数阈值法未能解决的失效模式。在MS MARCO(200个开发查询)上,ScoreGate以较标准Top-K少35%的保留分块实现MRR@10=0.401;在内部基准测试(n=300,Fleiss' kappa=0.87)中,ScoreGate在召回率为97.77%-99.34%时观测到零假阳性(95%CI [96.4%,100%]),每查询减少34.8%的token,仅增加31ms延迟。在MS MARCO与实际生产流量上的结果均表明,自适应检索基数可在不降低检索质量的前提下提升检索效率。

0
下载
关闭预览

相关内容

多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
推荐系统融合排序的多目标寻优技术
专知会员服务
19+阅读 · 2024年8月17日
专知会员服务
48+阅读 · 2020年10月20日
自动特征工程在推荐系统中的研究
DataFunTalk
10+阅读 · 2019年12月20日
非平衡数据集 focal loss 多类分类
AI研习社
33+阅读 · 2019年4月23日
变分自编码器VAE:一步到位的聚类方案
PaperWeekly
25+阅读 · 2018年9月18日
推荐系统算法合集,满满都是干货(建议收藏)
七月在线实验室
17+阅读 · 2018年7月23日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
重新思考无人机时代的生存能力
专知会员服务
3+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
3+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
4+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
4+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
5+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关VIP内容
多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
推荐系统融合排序的多目标寻优技术
专知会员服务
19+阅读 · 2024年8月17日
专知会员服务
48+阅读 · 2020年10月20日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员