Multi-Step Knowledge Interaction Analysis via Rank-2 Subspace Disentanglement - 专知论文

会员服务 ·

0

知识 · 交互 · 参数化 · 子空间 · 分析 ·

Multi-Step Knowledge Interaction Analysis via Rank-2 Subspace Disentanglement

翻译：基于秩-2子空间解缠的多步知识交互分析

Sekh Mainul Islam,Pepa Atanasova,Isabelle Augenstein

from arxiv, Under review

Natural Language Explanations (NLEs) describe how Large Language Models (LLMs) make decisions by drawing on external Context Knowledge (CK) and Parametric Knowledge (PK). Understanding the interaction between these sources is key to assessing NLE grounding, yet these dynamics remain underexplored. Prior work has largely focused on (1) single-step generation and (2) modelled PK-CK interaction as a binary choice within a rank-1 subspace. This approach overlooks richer interactions and how they unfold over longer generations, such as complementary or supportive knowledge. We propose a novel rank-2 projection subspace that disentangles PK and CK contributions more accurately and use it for the first multi-step analysis of knowledge interactions across longer NLE sequences. Experiments across four QA datasets and three open-weight LLMs demonstrate that while rank-1 subspaces struggle to represent diverse interactions, our rank-2 formulation captures them effectively, highlighting PK alignment for supportive interactions and CK alignment for conflicting ones. Our multi-step analysis reveals, among others, that hallucinated generations exhibit strong alignment with the PK direction, whereas context-faithful generations maintain a more balanced alignment between PK and CK.

翻译：自然语言解释通过利用外部语境知识和参数化知识来描述大语言模型的决策过程。理解这两种知识源之间的交互是评估自然语言解释基础性的关键，然而这些动态机制仍未得到充分探索。先前研究主要集中于（1）单步生成，以及（2）在秩-1子空间中将参数化知识与语境知识的交互建模为二元选择。这种方法忽略了更丰富的交互模式及其在生成长序列过程中的演变，例如互补性或支持性知识。我们提出了一种新颖的秩-2投影子空间，能够更精确地解耦参数化知识与语境知识的贡献，并首次将其用于跨长序列自然语言解释的多步知识交互分析。在四个问答数据集和三个开源权重大语言模型上的实验表明：秩-1子空间难以表征多样化的知识交互，而我们的秩-2建模方法能有效捕捉这些交互，突显支持性交互中参数化知识的对齐性以及冲突性交互中语境知识的对齐性。我们的多步分析进一步揭示，幻觉生成结果表现出与参数化知识方向的强对齐性，而语境可信的生成结果则保持参数化知识与语境知识间更均衡的对齐关系。

0

相关内容

从感知到认知：多模态大语言模型中视觉-语言交互推理综述

从感知到认知：多模态大语言模型中视觉-语言交互推理综述

专知会员服务

30+阅读 · 2025年10月1日

【博士论文】结构与解构：知识引擎生成中的双重力量

【博士论文】结构与解构：知识引擎生成中的双重力量

专知会员服务

23+阅读 · 2025年9月5日

【博士论文】多模态语言模型中的学习、推理和组合泛化，204页pdf

【博士论文】多模态语言模型中的学习、推理和组合泛化，204页pdf

专知会员服务

36+阅读 · 2024年5月26日

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

专知会员服务

64+阅读 · 2023年11月7日

多模态学习有哪些架构？MBZUAI最新《多模态表示学习》综述，29页:演化、预训练及其应用综述

多模态学习有哪些架构？MBZUAI最新《多模态表示学习》综述，29页:演化、预训练及其应用综述

专知会员服务

67+阅读 · 2023年2月5日

微软等ACL2022《知识增强自然语言处理》教程，阐述最新前沿技术，附Slides

微软等ACL2022《知识增强自然语言处理》教程，阐述最新前沿技术，附Slides

专知会员服务

41+阅读 · 2022年5月24日

上海交大最新《多轮对话理解》综述论文，20页pdf

上海交大最新《多轮对话理解》综述论文，20页pdf

专知会员服务

31+阅读 · 2021年10月12日

【神经自然语言处理进展：建模，学习，推理】Progress in Neural NLP: Modeling, Learning, and Reasoning

【神经自然语言处理进展：建模，学习，推理】Progress in Neural NLP: Modeling, Learning, and Reasoning

专知会员服务

78+阅读 · 2020年8月13日

综述：NLP中的深度学习优势，附21页论文下载

专知会员服务

104+阅读 · 2020年3月12日

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

专知会员服务

84+阅读 · 2019年11月20日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

51+阅读 · 2020年3月29日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

知识图谱在可解释人工智能中的作用，附81页ppt

知识图谱在可解释人工智能中的作用，附81页ppt

专知

89+阅读 · 2019年11月11日

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

专知

22+阅读 · 2019年10月23日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

论文浅尝 | 时序与因果关系联合推理

论文浅尝 | 时序与因果关系联合推理

开放知识图谱

36+阅读 · 2019年6月23日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

领域应用 | NLP 和知识图谱：金融科技领域的“双子星”

领域应用 | NLP 和知识图谱：金融科技领域的“双子星”

开放知识图谱

21+阅读 · 2018年8月12日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

多源异构盐城滨海湿地生态系统生境信息交互感知机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于形态和多词的有限语料蒙汉互译调序优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

种群遗传学的多人交互式学习研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Understanding the Interplay between LLMs' Utilisation of Parametric and Contextual Knowledge: A keynote at ECIR 2025

Arxiv

0+阅读 · 3月10日

Tri-Subspaces Disentanglement for Multimodal Sentiment Analysis

Arxiv

0+阅读 · 2月23日

Understanding vs. Generation: Navigating Optimization Dilemma in Multimodal Models

Arxiv

0+阅读 · 2月17日

Cross-Attention Speculative Decoding

Arxiv

0+阅读 · 2月11日

Beyond Next-Token Alignment: Distilling Multimodal Large Language Models via Token Interactions

Arxiv

0+阅读 · 2月10日

Asynchronous Reasoning: Training-Free Interactive Thinking LLMs

Arxiv

0+阅读 · 2月4日

From Consistency to Complementarity: Aligned and Disentangled Multi-modal Learning for Time Series Understanding and Reasoning

Arxiv

0+阅读 · 2月4日

Bridging the Knowledge-Prediction Gap in LLMs on Multiple-Choice Questions

Arxiv

0+阅读 · 2月4日

Learning Multi-type heterogeneous interacting particle systems

Arxiv

0+阅读 · 2月3日

Boosting metacognition in entangled human-AI interaction to navigate cognitive-behavioral drift

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

4+阅读 · 今天3:36

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

3+阅读 · 今天3:21

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

3+阅读 · 今天3:13

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 今天2:55

《基于Transformer的异常舰船导航识别与跟踪》80页

《基于Transformer的异常舰船导航识别与跟踪》80页

专知会员服务

4+阅读 · 今天2:45

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

专知会员服务

4+阅读 · 今天2:41

《低数据领域军事目标检测模型研究》

《低数据领域军事目标检测模型研究》

专知会员服务

3+阅读 · 今天2:37

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

专知会员服务

4+阅读 · 今天2:32

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

6+阅读 · 4月22日

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

9+阅读 · 4月22日

伊朗战争停火期间美军关键弹药状况分析

伊朗战争停火期间美军关键弹药状况分析

专知会员服务

8+阅读 · 4月22日

电子战革命：塑造战场的十年突破（2015–2025）

电子战革命：塑造战场的十年突破（2015–2025）

专知会员服务

6+阅读 · 4月22日

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

专知会员服务

9+阅读 · 4月22日

《基于模型的系统工程框架及其在电子战系统中的应用》

《基于模型的系统工程框架及其在电子战系统中的应用》

专知会员服务

7+阅读 · 4月22日

人工智能即服务与未来战争（印度视角）

人工智能即服务与未来战争（印度视角）

专知会员服务

5+阅读 · 4月22日

相关VIP内容

从感知到认知：多模态大语言模型中视觉-语言交互推理综述

从感知到认知：多模态大语言模型中视觉-语言交互推理综述

专知会员服务

30+阅读 · 2025年10月1日

【博士论文】结构与解构：知识引擎生成中的双重力量

【博士论文】结构与解构：知识引擎生成中的双重力量

专知会员服务

23+阅读 · 2025年9月5日

【博士论文】多模态语言模型中的学习、推理和组合泛化，204页pdf

【博士论文】多模态语言模型中的学习、推理和组合泛化，204页pdf

专知会员服务

36+阅读 · 2024年5月26日

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

【牛津大学博士论文】多模态深度学习在计算机视觉及其应用，138页pdf

专知会员服务

64+阅读 · 2023年11月7日

多模态学习有哪些架构？MBZUAI最新《多模态表示学习》综述，29页:演化、预训练及其应用综述

多模态学习有哪些架构？MBZUAI最新《多模态表示学习》综述，29页:演化、预训练及其应用综述

专知会员服务

67+阅读 · 2023年2月5日

微软等ACL2022《知识增强自然语言处理》教程，阐述最新前沿技术，附Slides

微软等ACL2022《知识增强自然语言处理》教程，阐述最新前沿技术，附Slides

专知会员服务

41+阅读 · 2022年5月24日

上海交大最新《多轮对话理解》综述论文，20页pdf

上海交大最新《多轮对话理解》综述论文，20页pdf

专知会员服务

31+阅读 · 2021年10月12日

【神经自然语言处理进展：建模，学习，推理】Progress in Neural NLP: Modeling, Learning, and Reasoning

【神经自然语言处理进展：建模，学习，推理】Progress in Neural NLP: Modeling, Learning, and Reasoning

专知会员服务

78+阅读 · 2020年8月13日

综述：NLP中的深度学习优势，附21页论文下载

专知会员服务

104+阅读 · 2020年3月12日

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

【BAAI北京智源大会】自然语言处理Knowledge-Guided NLP ，清华大学刘知远，附45页PDF

专知会员服务

84+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《压缩式分布式交互仿真标准》120页

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军条令《海军陆战队规划流程（2026版）》

《电子战数据交换模型研究报告》

相关资讯

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

51+阅读 · 2020年3月29日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

知识图谱在可解释人工智能中的作用，附81页ppt

知识图谱在可解释人工智能中的作用，附81页ppt

专知

89+阅读 · 2019年11月11日

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

专知

22+阅读 · 2019年10月23日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

论文浅尝 | 时序与因果关系联合推理

论文浅尝 | 时序与因果关系联合推理

开放知识图谱

36+阅读 · 2019年6月23日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

领域应用 | NLP 和知识图谱：金融科技领域的“双子星”

领域应用 | NLP 和知识图谱：金融科技领域的“双子星”

开放知识图谱

21+阅读 · 2018年8月12日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

相关论文

Understanding the Interplay between LLMs' Utilisation of Parametric and Contextual Knowledge: A keynote at ECIR 2025

Arxiv

0+阅读 · 3月10日

Tri-Subspaces Disentanglement for Multimodal Sentiment Analysis

Arxiv

0+阅读 · 2月23日

Understanding vs. Generation: Navigating Optimization Dilemma in Multimodal Models

Arxiv

0+阅读 · 2月17日

Cross-Attention Speculative Decoding

Arxiv

0+阅读 · 2月11日

Beyond Next-Token Alignment: Distilling Multimodal Large Language Models via Token Interactions

Arxiv

0+阅读 · 2月10日

Asynchronous Reasoning: Training-Free Interactive Thinking LLMs

Arxiv

0+阅读 · 2月4日

From Consistency to Complementarity: Aligned and Disentangled Multi-modal Learning for Time Series Understanding and Reasoning

Arxiv

0+阅读 · 2月4日

Bridging the Knowledge-Prediction Gap in LLMs on Multiple-Choice Questions

Arxiv

0+阅读 · 2月4日

Learning Multi-type heterogeneous interacting particle systems

Arxiv

0+阅读 · 2月3日

Boosting metacognition in entangled human-AI interaction to navigate cognitive-behavioral drift

Arxiv

0+阅读 · 2月2日

相关基金

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

多源异构盐城滨海湿地生态系统生境信息交互感知机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于形态和多词的有限语料蒙汉互译调序优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

种群遗传学的多人交互式学习研究

国家自然科学基金

0+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员