RAG-Match: Retrieval-Augmented Knowledge Injection and Hierarchical Reasoning for Calibrated Semantic Relevance - 专知论文

会员服务 ·

0

相关性 · 知识 · 语义相关性 · 排序 · 监督 ·

RAG-Match: Retrieval-Augmented Knowledge Injection and Hierarchical Reasoning for Calibrated Semantic Relevance

翻译：RAG-Match：面向校准语义相关性的检索增强知识注入与层次化推理

Hengjun Jiang,Liansheng Sun,Yan Jiang,Xiaojie Ke,Yongjin Wang,Xiangkun Liu,Cunxin Gu,Jian Xu,Guanjun Jiang

from arxiv, 17 pages, 1 figure, 5 tables

Semantic relevance judgment for search is particularly challenging in knowledge-intensive scenarios, where accurate ranking requires not only semantic matching but also background grounding, multi-step reasoning, and well-calibrated decision boundaries. Existing relevance models mainly rely on direct label supervision or shallow semantic similarity, which limits their ability to handle implicit intent, factual equivalence, and fine-grained relevance distinctions. To address this issue, we propose \textsc{RAG-Match}, a three-stage framework that integrates knowledge-augmented pretraining, hierarchical reasoning alignment, and preference-based decision calibration for relevance modeling. The key idea is to first strengthen query-centered semantic grounding, then align the model with structured relevance reasoning, and finally correct decision-level inconsistencies in difficult boundary cases. Experimental results on a real-world search relevance benchmark show that \textsc{RAG-Match} consistently outperforms strong LLM-based baselines across multiple ranking metrics, demonstrating the effectiveness of combining knowledge injection, reasoning supervision, and preference optimization for fine-grained relevance judgment.

翻译：语义相关性判断在知识密集型搜索场景中尤为困难，准确排序不仅需要语义匹配，还需背景知识支撑、多步推理以及校准的决策边界。现有相关性模型主要依赖直接标签监督或浅层语义相似度，难以处理隐式意图、事实等价关系及细粒度相关性差异。针对该问题，我们提出\textsc{RAG-Match}三阶段框架，融合知识增强预训练、层次化推理对齐与基于偏好的决策校准进行相关性建模。其核心思想是：首先强化以查询为中心的语义背景理解，然后使模型与结构化相关性推理对齐，最后修正困难边界案例中的决策层不一致性。基于真实搜索相关性基准的实验结果表明，\textsc{RAG-Match}在多个排序指标上持续优于强LLM基线模型，验证了知识注入、推理监督与偏好优化相结合对细粒度相关性判断的有效性。

0

相关内容

相关性

《军事场景上下文推理：大语言模型长上下文地理空间推理与规划能力基准测试》最新资料

《军事场景上下文推理：大语言模型长上下文地理空间推理与规划能力基准测试》最新资料

专知会员服务

37+阅读 · 3月14日

【UCSD博士论文】衔接语言模型与结构化知识：抽取、表示与推理

【UCSD博士论文】衔接语言模型与结构化知识：抽取、表示与推理

专知会员服务

18+阅读 · 2025年5月11日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

「可解释知识图谱推理」最新方法综述

「可解释知识图谱推理」最新方法综述

专知会员服务

89+阅读 · 2022年12月17日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

专知会员服务

44+阅读 · 2020年4月30日

知识图谱如何用于推荐系统？中科院计算所百度微软等学者最新综述论文40+最新方法阐述KG提升RS准确性与可解释性

知识图谱如何用于推荐系统？中科院计算所百度微软等学者最新综述论文40+最新方法阐述KG提升RS准确性与可解释性

专知会员服务

142+阅读 · 2020年3月12日

【报告】知识图谱中的关联搜索，南京大学计算机科学与技术系副教授| 程龚

【报告】知识图谱中的关联搜索，南京大学计算机科学与技术系副教授| 程龚

专知会员服务

126+阅读 · 2019年12月14日

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

专知会员服务

62+阅读 · 2019年10月25日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

「中国法研杯」相似案例匹配竞赛结果出炉，冠军方案关键技术解读

「中国法研杯」相似案例匹配竞赛结果出炉，冠军方案关键技术解读

AI科技评论

17+阅读 · 2019年10月28日

论文盘点：CVPR 2019 - 文本检测专题

论文盘点：CVPR 2019 - 文本检测专题

PaperWeekly

14+阅读 · 2019年5月31日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

一种关键字提取新方法

一种关键字提取新方法

1号机器人网

21+阅读 · 2018年11月15日

《pyramid Attention Network for Semantic Segmentation》

《pyramid Attention Network for Semantic Segmentation》

统计学习与视觉计算组

44+阅读 · 2018年8月30日

推荐系统算法合集，满满都是干货（建议收藏）

推荐系统算法合集，满满都是干货（建议收藏）

七月在线实验室

17+阅读 · 2018年7月23日

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

专知

19+阅读 · 2018年3月16日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

随机映射框架下的图像语义分析与提取技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于相关性的大数据分类理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

RoTRAG: Rule of Thumb Reasoning for Conversation Harm Detection with Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月15日

MIRAGE: Runtime Scheduling for Multi-Vector Image Retrieval with Hierarchical Decomposition

Arxiv

0+阅读 · 6月13日

CASHEW: Stabilizing Multimodal Reasoning via Iterative Trajectory Aggregation

Arxiv

0+阅读 · 6月13日

RankVR: Low-Rank Structure Perception and Value Recalibration for Robust Composed Image Retrieval

Arxiv

0+阅读 · 6月10日

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Arxiv

0+阅读 · 6月7日

RACT: Retrieval Augmented Column-Table Learning and Prediction for Multi-Table Schema Matching

Arxiv

0+阅读 · 6月5日

Graph-GRPO: Dependency-Aware Credit Assignment for Generative E-commerce Search Relevance

Arxiv

0+阅读 · 5月29日

Joint Optimization of Relevance and Engagement in Multi-Task Ranking for E-Commerce with Efficient LLM Supervision

Arxiv

0+阅读 · 5月26日

LLM-guided Hierarchical Search for End-to-end Reasoning Intensive Retrieval

Arxiv

0+阅读 · 5月25日

RAG-Enhanced Large Language Models for Dynamic Content Expiration Prediction in Web Search

Arxiv

0+阅读 · 5月13日

VIP会员

文章信息

相关主题

语义相关性

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

《军事场景上下文推理：大语言模型长上下文地理空间推理与规划能力基准测试》最新资料

《军事场景上下文推理：大语言模型长上下文地理空间推理与规划能力基准测试》最新资料

专知会员服务

37+阅读 · 3月14日

【UCSD博士论文】衔接语言模型与结构化知识：抽取、表示与推理

【UCSD博士论文】衔接语言模型与结构化知识：抽取、表示与推理

专知会员服务

18+阅读 · 2025年5月11日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

「可解释知识图谱推理」最新方法综述

「可解释知识图谱推理」最新方法综述

专知会员服务

89+阅读 · 2022年12月17日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

专知会员服务

44+阅读 · 2020年4月30日

知识图谱如何用于推荐系统？中科院计算所百度微软等学者最新综述论文40+最新方法阐述KG提升RS准确性与可解释性

知识图谱如何用于推荐系统？中科院计算所百度微软等学者最新综述论文40+最新方法阐述KG提升RS准确性与可解释性

专知会员服务

142+阅读 · 2020年3月12日

【报告】知识图谱中的关联搜索，南京大学计算机科学与技术系副教授| 程龚

【报告】知识图谱中的关联搜索，南京大学计算机科学与技术系副教授| 程龚

专知会员服务

126+阅读 · 2019年12月14日

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

知识图谱与语义理解，百度研究院王海峰院长，CCKS-2019：知识智能

专知会员服务

62+阅读 · 2019年10月25日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

「中国法研杯」相似案例匹配竞赛结果出炉，冠军方案关键技术解读

「中国法研杯」相似案例匹配竞赛结果出炉，冠军方案关键技术解读

AI科技评论

17+阅读 · 2019年10月28日

论文盘点：CVPR 2019 - 文本检测专题

论文盘点：CVPR 2019 - 文本检测专题

PaperWeekly

14+阅读 · 2019年5月31日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

一种关键字提取新方法

一种关键字提取新方法

1号机器人网

21+阅读 · 2018年11月15日

《pyramid Attention Network for Semantic Segmentation》

《pyramid Attention Network for Semantic Segmentation》

统计学习与视觉计算组

44+阅读 · 2018年8月30日

推荐系统算法合集，满满都是干货（建议收藏）

推荐系统算法合集，满满都是干货（建议收藏）

七月在线实验室

17+阅读 · 2018年7月23日

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

专知

19+阅读 · 2018年3月16日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

相关论文

RoTRAG: Rule of Thumb Reasoning for Conversation Harm Detection with Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月15日

MIRAGE: Runtime Scheduling for Multi-Vector Image Retrieval with Hierarchical Decomposition

Arxiv

0+阅读 · 6月13日

CASHEW: Stabilizing Multimodal Reasoning via Iterative Trajectory Aggregation

Arxiv

0+阅读 · 6月13日

RankVR: Low-Rank Structure Perception and Value Recalibration for Robust Composed Image Retrieval

Arxiv

0+阅读 · 6月10日

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Arxiv

0+阅读 · 6月7日

RACT: Retrieval Augmented Column-Table Learning and Prediction for Multi-Table Schema Matching

Arxiv

0+阅读 · 6月5日

Graph-GRPO: Dependency-Aware Credit Assignment for Generative E-commerce Search Relevance

Arxiv

0+阅读 · 5月29日

Joint Optimization of Relevance and Engagement in Multi-Task Ranking for E-Commerce with Efficient LLM Supervision

Arxiv

0+阅读 · 5月26日

LLM-guided Hierarchical Search for End-to-end Reasoning Intensive Retrieval

Arxiv

0+阅读 · 5月25日

RAG-Enhanced Large Language Models for Dynamic Content Expiration Prediction in Web Search

Arxiv

0+阅读 · 5月13日

相关基金

随机映射框架下的图像语义分析与提取技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于相关性的大数据分类理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员