Two-hop QA retrieval splits queries into two regimes determined by whether the hop-2 entity is explicitly named in the question (Q-dominant) or only in the bridge passage (B-dominant). We formalize this split with three theorems: (T1) per-query AUC is a monotone function of the cosine separation margin, with R^2 >= 0.90 for six of eight type-encoder pairs; (T2) regime is characterized by two surface-text predicates, with P1 decisive for routing and P2 qualifying the B-dominant case, holding across three encoders and three datasets; and (T3) bridge advantage requires the relation-bearing sentence, not entity name alone, with removal causing an 8.6-14.1 pp performance drop (p < 0.001). Building on this theory, we propose RegimeRouter, a lightweight binary router that selects between question-only and question-plus-relation-sentence retrieval using five text features derived directly from the predicate definitions. Trained on 2WikiMultiHopQA (n = 881, 5-fold cross-fitted) and applied zero-shot to MuSiQue and HotpotQA, RegimeRouter achieves +5.6 pp (p < 0.001), +5.3 pp (p = 0.002), and +1.1 pp (non-significant, no-regret) R@5 improvement, respectively, with artifact-driven.


翻译:双跳问答检索将查询划分为两类状态:取决于跳-2实体是在问题中显式命名(Q主导型),还是仅出现在桥接段落中(B主导型)。我们通过三个定理形式化这一划分:(T1)逐查询AUC是余弦分离间隔的单调函数,在八个类型-编码器对中的六个上R²≥0.90;(T2)状态由两个表层文本谓词刻画,其中P1决定路由方向,P2限定B主导型情况,该结论在三个编码器和三个数据集上均成立;(T3)桥接优势依赖于携带关系的句子而非仅实体名称,移除该句子会导致8.6-14.1个百分点的性能下降(p<0.001)。基于该理论,我们提出RegimeRouter——一种轻量级二元路由机制,利用直接从谓词定义导出的五个文本特征,在仅问题检索与问题加关系句子检索之间进行选择。该路由在2WikiMultiHopQA上训练(n=881,5折交叉拟合),零样本迁移至MuSiQue和HotpotQA后,R@5分别提升+5.6个百分点(p<0.001)、+5.3个百分点(p=0.002)和+1.1个百分点(无统计显著性,无遗憾),且具有可解释性。

0
下载
关闭预览

相关内容

ICML 2026 | SARDI:扩散语言模型的自增强检索
专知会员服务
9+阅读 · 6月6日
《跨模态检索》最新2023综述
专知会员服务
49+阅读 · 2023年9月5日
NeurIPS 2021 | ConE: 针对知识图谱多跳推理的锥嵌入模型
专知会员服务
26+阅读 · 2021年12月5日
专知会员服务
53+阅读 · 2021年8月13日
专知会员服务
90+阅读 · 2021年6月13日
专知会员服务
62+阅读 · 2021年3月25日
【WSDM2021】通过学习中间监督信号改进多跳知识库问答
专知会员服务
11+阅读 · 2021年1月14日
专知会员服务
48+阅读 · 2020年10月20日
Query 理解和语义召回在知乎搜索中的应用
DataFunTalk
25+阅读 · 2020年1月2日
论文浅尝 | 一种用于多关系问答的可解释推理网络
开放知识图谱
18+阅读 · 2019年5月21日
论文浅尝 | 常识用于回答生成式多跳问题
开放知识图谱
16+阅读 · 2018年11月24日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月16日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关VIP内容
ICML 2026 | SARDI:扩散语言模型的自增强检索
专知会员服务
9+阅读 · 6月6日
《跨模态检索》最新2023综述
专知会员服务
49+阅读 · 2023年9月5日
NeurIPS 2021 | ConE: 针对知识图谱多跳推理的锥嵌入模型
专知会员服务
26+阅读 · 2021年12月5日
专知会员服务
53+阅读 · 2021年8月13日
专知会员服务
90+阅读 · 2021年6月13日
专知会员服务
62+阅读 · 2021年3月25日
【WSDM2021】通过学习中间监督信号改进多跳知识库问答
专知会员服务
11+阅读 · 2021年1月14日
专知会员服务
48+阅读 · 2020年10月20日
相关资讯
Query 理解和语义召回在知乎搜索中的应用
DataFunTalk
25+阅读 · 2020年1月2日
论文浅尝 | 一种用于多关系问答的可解释推理网络
开放知识图谱
18+阅读 · 2019年5月21日
论文浅尝 | 常识用于回答生成式多跳问题
开放知识图谱
16+阅读 · 2018年11月24日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员