SUIT: Knowledge Editing with Subspace-Aware Key-Value Mappings - 专知论文

会员服务 ·

0

知识 · 子空间 · 知识编辑 · 映射 · 扰动 ·

SUIT: Knowledge Editing with Subspace-Aware Key-Value Mappings

翻译：SUIT：基于子空间感知键值映射的知识编辑

Haewon Park,Sangwoo Kim,Yohan Jo

from arxiv, 31 pages, 13 figures, 17 tables

Knowledge editing aims to efficiently correct factual errors in language models. Widely used locate-then-edit methods update an MLP layer by adjusting its weights to change the mapping between the layer's input vector (key) and output vector (value), thereby editing the model's knowledge. As this update is driven by key and value vectors, obtaining these vectors without careful constraints causes significant model perturbations beyond the targeted edit, a common issue in many prior knowledge editing methods. To address this, we propose Subspace Knowledge Edit (SUIT), which computes key and value vectors only within the subspace of critical features relevant to the edit. Our empirical results on LLaMA3, GPT-J, and Qwen2.5 models show that SUIT dramatically improves knowledge preservation over strong baselines while maintaining high editing performance. These results support the claim that SUIT successfully identifies the critical subspace for the edit. Beyond quantitative gains, our analyses show that SUIT reduces unintended perturbations in hidden states while confining updates to directions that are more effective for editing. Taken together, these findings establish edit-critical subspace identification as a key principle for reliable, low-perturbation knowledge editing. Our code is available at https://github.com/holi-lab/SUIT.

翻译：知识编辑旨在高效修正语言模型中的事实性错误。广泛使用的"定位-编辑"方法通过调整MLP层权重来改变该层输入向量（键）与输出向量（值）之间的映射关系，从而实现知识编辑。由于这种更新由键向量和值向量驱动，在缺乏严格约束的情况下获取这些向量会导致模型产生超出目标编辑范围的显著扰动，这是许多现有知识编辑方法的常见问题。为解决这一问题，我们提出子空间知识编辑方法（SUIT），该方法仅在编辑相关的关键特征子空间内计算键向量和值向量。我们在LLaMA3、GPT-J和Qwen2.5模型上的实验结果表明，SUIT在保持高水平编辑性能的同时，相比现有强基线方法显著提升了知识保留能力。这些结果证实了SUIT能够成功识别编辑所需的关键子空间。除量化指标外，我们的分析表明SUIT能减少隐藏状态中的非预期扰动，同时将更新限制在更有效的编辑方向上。综合来看，这些发现确立了编辑关键子空间识别作为实现可靠、低扰动知识编辑的核心原则。代码已开源：https://github.com/holi-lab/SUIT。

0

相关内容

【CVPR2026】CARE-Edit: 面向上下文相关图像编辑的条件感知专家路由机制

【CVPR2026】CARE-Edit: 面向上下文相关图像编辑的条件感知专家路由机制

专知会员服务

6+阅读 · 3月10日

大模型推理时代的知识编辑

大模型推理时代的知识编辑

专知会员服务

30+阅读 · 2025年12月22日

【CVPR2025】基于低秩专家混合机制的视觉语言模型终身知识编辑

【CVPR2025】基于低秩专家混合机制的视觉语言模型终身知识编辑

专知会员服务

14+阅读 · 2025年4月14日

【NeurIPS2024】迈向统一的多模态编辑与增强的知识协作

【NeurIPS2024】迈向统一的多模态编辑与增强的知识协作

专知会员服务

20+阅读 · 2024年10月1日

【COLING教程】大型语言模型的知识编辑，193页ppt

【COLING教程】大型语言模型的知识编辑，193页ppt

专知会员服务

42+阅读 · 2024年5月30日

【AAAI2024】历史的重要性：大型语言模型中的时序知识编辑

【AAAI2024】历史的重要性：大型语言模型中的时序知识编辑

专知会员服务

41+阅读 · 2023年12月13日

大模型怎么用知识？哈工大等最新《知识与大型语言模型整合趋势》综述，详述知识编辑与检索增强方法

大模型怎么用知识？哈工大等最新《知识与大型语言模型整合趋势》综述，详述知识编辑与检索增强方法

专知会员服务

98+阅读 · 2023年11月13日

《预训练具有信息性事实知识和专业知识库的军事语言表示模型》南京理工等

《预训练具有信息性事实知识和专业知识库的军事语言表示模型》南京理工等

专知会员服务

59+阅读 · 2023年4月21日

知识在大模型中如何用？中科院软件所最新《大型语言模型知识生命周期》综述，27页pdf阐述知识获取、表示、探测、编辑与应用

知识在大模型中如何用？中科院软件所最新《大型语言模型知识生命周期》综述，27页pdf阐述知识获取、表示、探测、编辑与应用

专知会员服务

88+阅读 · 2023年3月17日

【SIGIR2020】基于知识图谱的公平感知可解释推荐，Fairness-Aware Explainable Recommendation over Knowledge Graphs

【SIGIR2020】基于知识图谱的公平感知可解释推荐，Fairness-Aware Explainable Recommendation over Knowledge Graphs

专知会员服务

47+阅读 · 2020年6月3日

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

开放知识图谱

13+阅读 · 2022年3月8日

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

常识知识图谱如何用在计算机视觉?华盛顿大学Yejin Choi最新86页PPT及论文讲解

常识知识图谱如何用在计算机视觉?华盛顿大学Yejin Choi最新86页PPT及论文讲解

专知

34+阅读 · 2020年1月8日

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

开放知识图谱

61+阅读 · 2019年6月11日

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

专知

82+阅读 · 2019年6月9日

免费报名 | 详解知识图谱关键技术与应用案例

免费报名 | 详解知识图谱关键技术与应用案例

AI100

18+阅读 · 2018年8月6日

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

专知

18+阅读 · 2018年4月2日

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

专知

19+阅读 · 2018年3月26日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

Beyond the Covariance Trap: Unlocking Generalization in Same-Subject Knowledge Editing for Large Language Models

Arxiv

0+阅读 · 3月16日

Beyond Memorization: A Rigorous Evaluation Framework for Medical Knowledge Editing

Arxiv

0+阅读 · 2月15日

MoEEdit: Efficient and Routing-Stable Knowledge Editing for Mixture-of-Experts LLMs

Arxiv

0+阅读 · 2月11日

On the Robustness of Knowledge Editing for Detoxification

Arxiv

0+阅读 · 2月11日

EAMET: Robust Massive Model Editing via Embedding Alignment Optimization

Arxiv

0+阅读 · 2月10日

Toward Ultra-Long-Horizon Sequential Model Editing

Arxiv

0+阅读 · 2月10日

FusionEdit: Semantic Fusion and Attention Modulation for Training-Free Image Editing

Arxiv

0+阅读 · 2月9日

ReasonEdit: Editing Vision-Language Models using Human Reasoning

Arxiv

0+阅读 · 2月7日

SpIDER: Spatially Informed Dense Embedding Retrieval for Software Issue Localization

Arxiv

0+阅读 · 2月5日

ReasonEdit: Editing Vision-Language Models using Human Reasoning

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

【CVPR2026】CARE-Edit: 面向上下文相关图像编辑的条件感知专家路由机制

【CVPR2026】CARE-Edit: 面向上下文相关图像编辑的条件感知专家路由机制

专知会员服务

6+阅读 · 3月10日

大模型推理时代的知识编辑

大模型推理时代的知识编辑

专知会员服务

30+阅读 · 2025年12月22日

【CVPR2025】基于低秩专家混合机制的视觉语言模型终身知识编辑

【CVPR2025】基于低秩专家混合机制的视觉语言模型终身知识编辑

专知会员服务

14+阅读 · 2025年4月14日

【NeurIPS2024】迈向统一的多模态编辑与增强的知识协作

【NeurIPS2024】迈向统一的多模态编辑与增强的知识协作

专知会员服务

20+阅读 · 2024年10月1日

【COLING教程】大型语言模型的知识编辑，193页ppt

【COLING教程】大型语言模型的知识编辑，193页ppt

专知会员服务

42+阅读 · 2024年5月30日

【AAAI2024】历史的重要性：大型语言模型中的时序知识编辑

【AAAI2024】历史的重要性：大型语言模型中的时序知识编辑

专知会员服务

41+阅读 · 2023年12月13日

大模型怎么用知识？哈工大等最新《知识与大型语言模型整合趋势》综述，详述知识编辑与检索增强方法

大模型怎么用知识？哈工大等最新《知识与大型语言模型整合趋势》综述，详述知识编辑与检索增强方法

专知会员服务

98+阅读 · 2023年11月13日

《预训练具有信息性事实知识和专业知识库的军事语言表示模型》南京理工等

《预训练具有信息性事实知识和专业知识库的军事语言表示模型》南京理工等

专知会员服务

59+阅读 · 2023年4月21日

知识在大模型中如何用？中科院软件所最新《大型语言模型知识生命周期》综述，27页pdf阐述知识获取、表示、探测、编辑与应用

知识在大模型中如何用？中科院软件所最新《大型语言模型知识生命周期》综述，27页pdf阐述知识获取、表示、探测、编辑与应用

专知会员服务

88+阅读 · 2023年3月17日

【SIGIR2020】基于知识图谱的公平感知可解释推荐，Fairness-Aware Explainable Recommendation over Knowledge Graphs

【SIGIR2020】基于知识图谱的公平感知可解释推荐，Fairness-Aware Explainable Recommendation over Knowledge Graphs

专知会员服务

47+阅读 · 2020年6月3日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

开放知识图谱

13+阅读 · 2022年3月8日

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

常识知识图谱如何用在计算机视觉?华盛顿大学Yejin Choi最新86页PPT及论文讲解

常识知识图谱如何用在计算机视觉?华盛顿大学Yejin Choi最新86页PPT及论文讲解

专知

34+阅读 · 2020年1月8日

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

论文浅尝 | 最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

开放知识图谱

61+阅读 · 2019年6月11日

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

最新10篇《知识图谱》论文推荐(ICML, CVPR, ACL, KDD, IJCAI 2019)

专知

82+阅读 · 2019年6月9日

免费报名 | 详解知识图谱关键技术与应用案例

免费报名 | 详解知识图谱关键技术与应用案例

AI100

18+阅读 · 2018年8月6日

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

专知

18+阅读 · 2018年4月2日

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

专知

19+阅读 · 2018年3月26日

相关论文

Beyond the Covariance Trap: Unlocking Generalization in Same-Subject Knowledge Editing for Large Language Models

Arxiv

0+阅读 · 3月16日

Beyond Memorization: A Rigorous Evaluation Framework for Medical Knowledge Editing

Arxiv

0+阅读 · 2月15日

MoEEdit: Efficient and Routing-Stable Knowledge Editing for Mixture-of-Experts LLMs

Arxiv

0+阅读 · 2月11日

On the Robustness of Knowledge Editing for Detoxification

Arxiv

0+阅读 · 2月11日

EAMET: Robust Massive Model Editing via Embedding Alignment Optimization

Arxiv

0+阅读 · 2月10日

Toward Ultra-Long-Horizon Sequential Model Editing

Arxiv

0+阅读 · 2月10日

FusionEdit: Semantic Fusion and Attention Modulation for Training-Free Image Editing

Arxiv

0+阅读 · 2月9日

ReasonEdit: Editing Vision-Language Models using Human Reasoning

Arxiv

0+阅读 · 2月7日

SpIDER: Spatially Informed Dense Embedding Retrieval for Software Issue Localization

Arxiv

0+阅读 · 2月5日

ReasonEdit: Editing Vision-Language Models using Human Reasoning

Arxiv

0+阅读 · 2月2日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员