Retrieval--Reasoning Processes for Multi-hop Question Answering: A Four-Axis Design Framework and Empirical Trends - 专知论文

会员服务 ·

0

多跳 · 多跳问答 · 问答 · 自动问答 · 系统 ·

Retrieval--Reasoning Processes for Multi-hop Question Answering: A Four-Axis Design Framework and Empirical Trends

翻译：多跳问答中的检索-推理过程：四轴设计框架与实证趋势

Yuelyu Ji,Zhuochun Li,Rui Meng,Daqing He

Multi-hop question answering (QA) requires systems to iteratively retrieve evidence and reason across multiple hops. While recent RAG and agentic methods report strong results, the underlying retrieval--reasoning \emph{process} is often left implicit, making procedural choices hard to compare across model families. This survey takes the execution procedure as the unit of analysis and introduces a four-axis framework covering (A) overall execution plan, (B) index structure, (C) next-step control (strategies and triggers), and (D) stop/continue criteria. Using this schema, we map representative multi-hop QA systems and synthesize reported ablations and tendencies on standard benchmarks (e.g., HotpotQA, 2WikiMultiHopQA, MuSiQue), highlighting recurring trade-offs among effectiveness, efficiency, and evidence faithfulness. We conclude with open challenges for retrieval--reasoning agents, including structure-aware planning, transferable control policies, and robust stopping under distribution shift.

翻译：多跳问答（QA）要求系统迭代地检索证据并进行跨多跳的推理。尽管近期的检索增强生成（RAG）与智能体方法报告了强劲的结果，但其底层的检索-推理**过程**往往隐而不显，导致不同模型族之间的流程选择难以比较。本综述以执行过程为分析单元，提出了一个四轴框架，涵盖（A）整体执行计划、（B）索引结构、（C）下一步控制（策略与触发机制）以及（D）停止/继续准则。基于此框架，我们对代表性的多跳问答系统进行了梳理，综合了在标准基准（如HotpotQA、2WikiMultiHopQA、MuSiQue）上报告的消融实验与趋势，揭示了在效果、效率与证据忠实度之间反复出现的权衡关系。最后，我们提出了检索-推理智能体面临的开放挑战，包括结构感知的规划、可迁移的控制策略，以及分布偏移下的鲁棒停止机制。

0

相关内容

【HKUST博士论文】知识图谱推理的进展：复杂查询应答与逻辑假设生成的创新方法

【HKUST博士论文】知识图谱推理的进展：复杂查询应答与逻辑假设生成的创新方法

专知会员服务

20+阅读 · 2025年6月24日

【CMU博士论文】神经推理问答，151页pdf

【CMU博士论文】神经推理问答，151页pdf

专知会员服务

46+阅读 · 2023年6月5日

《基于大型知识库进行问答的非参数化上下文推理》2022最新177页博士论文，马萨诸塞大学阿默斯特分校

《基于大型知识库进行问答的非参数化上下文推理》2022最新177页博士论文，马萨诸塞大学阿默斯特分校

专知会员服务

27+阅读 · 2022年8月5日

NeurIPS 2021 | ConE: 针对知识图谱多跳推理的锥嵌入模型

NeurIPS 2021 | ConE: 针对知识图谱多跳推理的锥嵌入模型

专知会员服务

26+阅读 · 2021年12月5日

斯坦福大学Jure团队提出《大规模可扩展知识图谱多跳推理框架SMORE》，实现单机运行8千万实体3亿级知识图谱推理

斯坦福大学Jure团队提出《大规模可扩展知识图谱多跳推理框架SMORE》，实现单机运行8千万实体3亿级知识图谱推理

专知会员服务

58+阅读 · 2021年11月3日

知识图谱多跳问答推理研究进展、挑战与展望

专知会员服务

90+阅读 · 2021年6月13日

【WSDM2021】通过学习中间监督信号改进多跳知识库问答

【WSDM2021】通过学习中间监督信号改进多跳知识库问答

专知会员服务

11+阅读 · 2021年1月14日

【AAAI2021】维基百科检索跳转来回答复杂的问题

【AAAI2021】维基百科检索跳转来回答复杂的问题

专知会员服务

15+阅读 · 2021年1月5日

【NeurIPS 2020 - 斯坦福】知识图谱中多跳逻辑推理的Beta嵌入

【NeurIPS 2020 - 斯坦福】知识图谱中多跳逻辑推理的Beta嵌入

专知会员服务

45+阅读 · 2020年10月24日

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

专知会员服务

95+阅读 · 2019年11月8日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

如何搭建一个基于知识图谱的问答系统（以医疗行业为例）

如何搭建一个基于知识图谱的问答系统（以医疗行业为例）

PaperWeekly

51+阅读 · 2019年11月17日

【清华大学】元知识图谱推理

【清华大学】元知识图谱推理

专知

129+阅读 · 2019年9月2日

论文浅尝 | 一种用于多关系问答的可解释推理网络

论文浅尝 | 一种用于多关系问答的可解释推理网络

开放知识图谱

18+阅读 · 2019年5月21日

论文浅尝 | 常识用于回答生成式多跳问题

论文浅尝 | 常识用于回答生成式多跳问题

开放知识图谱

16+阅读 · 2018年11月24日

【论文推荐】最新九篇自动问答相关论文—可解释推理网络、上下文知识图谱嵌入、注意力RNN、Multi-Cast注意力网络

【论文推荐】最新九篇自动问答相关论文—可解释推理网络、上下文知识图谱嵌入、注意力RNN、Multi-Cast注意力网络

专知

15+阅读 · 2018年6月29日

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

专知

17+阅读 · 2018年6月7日

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

专知

15+阅读 · 2018年2月3日

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

专知

23+阅读 · 2018年1月17日

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

开放知识图谱

10+阅读 · 2017年8月6日

多重假设检验中的k-FWER控制

国家自然科学基金

0+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

14+阅读 · 2015年12月31日

三类多尺度问题的多尺度算法

国家自然科学基金

1+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

大数据环境下融合多源信息的推荐系统关键问题研究

国家自然科学基金

6+阅读 · 2014年12月31日

多元数据与函数型数据的序贯检验方法与控制图研究

国家自然科学基金

0+阅读 · 2014年12月31日

Optimizing Multi-Hop Document Retrieval Through Intermediate Representations

Arxiv

0+阅读 · 1月29日

When Iterative RAG Beats Ideal Evidence: A Diagnostic Study in Scientific Multi-hop Question Answering

Arxiv

0+阅读 · 1月27日

Reasoning in Trees: Improving Retrieval-Augmented Generation for Multi-Hop Question Answering

Arxiv

0+阅读 · 1月16日

Investigating Retrieval-Augmented Generation Systems on Unanswerable, Uncheatable, Realistic, Multi-hop Queries

Arxiv

0+阅读 · 1月14日

GlobalRAG: Enhancing Global Reasoning in Multi-hop Question Answering via Reinforcement Learning

Arxiv

0+阅读 · 1月12日

Credible Plan-Driven RAG Method for Multi-Hop Question Answering

Arxiv

0+阅读 · 1月12日

CIRAG: Construction-Integration Retrieval and Adaptive Generation for Multi-hop Question Answering

Arxiv

0+阅读 · 1月11日

SentGraph: Hierarchical Sentence Graph for Multi-hop Retrieval-Augmented Question Answering

Arxiv

0+阅读 · 1月6日

Multi-hop Reasoning via Early Knowledge Alignment

Arxiv

0+阅读 · 1月1日

Multi-step retrieval and reasoning improves radiology question answering with large language models

Arxiv

0+阅读 · 2025年12月30日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

3+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

5+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

3+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

2+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

10+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

7+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

5+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

3+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

6+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

3+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

3+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

7+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

6+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

10+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

5+阅读 · 4月20日

相关VIP内容

【HKUST博士论文】知识图谱推理的进展：复杂查询应答与逻辑假设生成的创新方法

【HKUST博士论文】知识图谱推理的进展：复杂查询应答与逻辑假设生成的创新方法

专知会员服务

20+阅读 · 2025年6月24日

【CMU博士论文】神经推理问答，151页pdf

【CMU博士论文】神经推理问答，151页pdf

专知会员服务

46+阅读 · 2023年6月5日

《基于大型知识库进行问答的非参数化上下文推理》2022最新177页博士论文，马萨诸塞大学阿默斯特分校

《基于大型知识库进行问答的非参数化上下文推理》2022最新177页博士论文，马萨诸塞大学阿默斯特分校

专知会员服务

27+阅读 · 2022年8月5日

NeurIPS 2021 | ConE: 针对知识图谱多跳推理的锥嵌入模型

NeurIPS 2021 | ConE: 针对知识图谱多跳推理的锥嵌入模型

专知会员服务

26+阅读 · 2021年12月5日

斯坦福大学Jure团队提出《大规模可扩展知识图谱多跳推理框架SMORE》，实现单机运行8千万实体3亿级知识图谱推理

斯坦福大学Jure团队提出《大规模可扩展知识图谱多跳推理框架SMORE》，实现单机运行8千万实体3亿级知识图谱推理

专知会员服务

58+阅读 · 2021年11月3日

知识图谱多跳问答推理研究进展、挑战与展望

专知会员服务

90+阅读 · 2021年6月13日

【WSDM2021】通过学习中间监督信号改进多跳知识库问答

【WSDM2021】通过学习中间监督信号改进多跳知识库问答

专知会员服务

11+阅读 · 2021年1月14日

【AAAI2021】维基百科检索跳转来回答复杂的问题

【AAAI2021】维基百科检索跳转来回答复杂的问题

专知会员服务

15+阅读 · 2021年1月5日

【NeurIPS 2020 - 斯坦福】知识图谱中多跳逻辑推理的Beta嵌入

【NeurIPS 2020 - 斯坦福】知识图谱中多跳逻辑推理的Beta嵌入

专知会员服务

45+阅读 · 2020年10月24日

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

专知会员服务

95+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

如何搭建一个基于知识图谱的问答系统（以医疗行业为例）

如何搭建一个基于知识图谱的问答系统（以医疗行业为例）

PaperWeekly

51+阅读 · 2019年11月17日

【清华大学】元知识图谱推理

【清华大学】元知识图谱推理

专知

129+阅读 · 2019年9月2日

论文浅尝 | 一种用于多关系问答的可解释推理网络

论文浅尝 | 一种用于多关系问答的可解释推理网络

开放知识图谱

18+阅读 · 2019年5月21日

论文浅尝 | 常识用于回答生成式多跳问题

论文浅尝 | 常识用于回答生成式多跳问题

开放知识图谱

16+阅读 · 2018年11月24日

【论文推荐】最新九篇自动问答相关论文—可解释推理网络、上下文知识图谱嵌入、注意力RNN、Multi-Cast注意力网络

【论文推荐】最新九篇自动问答相关论文—可解释推理网络、上下文知识图谱嵌入、注意力RNN、Multi-Cast注意力网络

专知

15+阅读 · 2018年6月29日

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

专知

17+阅读 · 2018年6月7日

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

专知

15+阅读 · 2018年2月3日

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

专知

23+阅读 · 2018年1月17日

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

开放知识图谱

10+阅读 · 2017年8月6日

相关论文

Optimizing Multi-Hop Document Retrieval Through Intermediate Representations

Arxiv

0+阅读 · 1月29日

When Iterative RAG Beats Ideal Evidence: A Diagnostic Study in Scientific Multi-hop Question Answering

Arxiv

0+阅读 · 1月27日

Reasoning in Trees: Improving Retrieval-Augmented Generation for Multi-Hop Question Answering

Arxiv

0+阅读 · 1月16日

Investigating Retrieval-Augmented Generation Systems on Unanswerable, Uncheatable, Realistic, Multi-hop Queries

Arxiv

0+阅读 · 1月14日

GlobalRAG: Enhancing Global Reasoning in Multi-hop Question Answering via Reinforcement Learning

Arxiv

0+阅读 · 1月12日

Credible Plan-Driven RAG Method for Multi-Hop Question Answering

Arxiv

0+阅读 · 1月12日

CIRAG: Construction-Integration Retrieval and Adaptive Generation for Multi-hop Question Answering

Arxiv

0+阅读 · 1月11日

SentGraph: Hierarchical Sentence Graph for Multi-hop Retrieval-Augmented Question Answering

Arxiv

0+阅读 · 1月6日

Multi-hop Reasoning via Early Knowledge Alignment

Arxiv

0+阅读 · 1月1日

Multi-step retrieval and reasoning improves radiology question answering with large language models

Arxiv

0+阅读 · 2025年12月30日

相关基金

多重假设检验中的k-FWER控制

国家自然科学基金

0+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

14+阅读 · 2015年12月31日

三类多尺度问题的多尺度算法

国家自然科学基金

1+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

大数据环境下融合多源信息的推荐系统关键问题研究

国家自然科学基金

6+阅读 · 2014年12月31日

多元数据与函数型数据的序贯检验方法与控制图研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员