骗我：利用知识图谱实现大语言模型幻觉的鲁棒自检测 (Lie to Me: Knowledge Graphs for Robust Hallucination Self-Detection in LLMs) - 专知论文

会员服务 ·

0

知识 · 图谱 · 自检测 · 语言模型 · 知识图谱 ·

2025 年 12 月 29 日

Lie to Me: Knowledge Graphs for Robust Hallucination Self-Detection in LLMs

翻译：骗我：利用知识图谱实现大语言模型幻觉的鲁棒自检测

Sahil Kale,Antonio Luca Alfeo

from arxiv, Accepted to ICPRAM 2026 in Marbella, Spain

Hallucinations, the generation of apparently convincing yet false statements, remain a major barrier to the safe deployment of LLMs. Building on the strong performance of self-detection methods, we examine the use of structured knowledge representations, namely knowledge graphs, to improve hallucination self-detection. Specifically, we propose a simple yet powerful approach that enriches hallucination self-detection by (i) converting LLM responses into knowledge graphs of entities and relations, and (ii) using these graphs to estimate the likelihood that a response contains hallucinations. We evaluate the proposed approach using two widely used LLMs, GPT-4o and Gemini-2.5-Flash, across two hallucination detection datasets. To support more reliable future benchmarking, one of these datasets has been manually curated and enhanced and is released as a secondary outcome of this work. Compared to standard self-detection methods and SelfCheckGPT, a state-of-the-art approach, our method achieves up to 16% relative improvement in accuracy and 20% in F1-score. Our results show that LLMs can better analyse atomic facts when they are structured as knowledge graphs, even when initial outputs contain inaccuracies. This low-cost, model-agnostic approach paves the way toward safer and more trustworthy language models.

翻译：幻觉（即生成看似可信实则错误的陈述）仍是阻碍大语言模型安全部署的主要障碍。基于自检测方法的优异表现，本研究探索利用结构化知识表征——即知识图谱——来提升幻觉自检测性能。具体而言，我们提出一种简洁而高效的方法，通过以下两个步骤增强幻觉自检测能力：（i）将大语言模型生成的回答转化为实体关系知识图谱；（ii）利用这些图谱评估回答包含幻觉的可能性。我们使用GPT-4o和Gemini-2.5-Flash两种主流大语言模型，在两个幻觉检测数据集上评估了所提方法。为支持未来更可靠的基准测试，其中一个数据集经过人工校勘与增强，将作为本研究的副产物公开发布。相较于标准自检测方法及当前最先进的SelfCheckGPT方法，我们的方法在准确率上最高获得16%的相对提升，F1分数提升达20%。实验结果表明，即使初始输出存在错误，大语言模型也能更有效地分析以知识图谱结构化的原子事实。这种低成本、模型无关的方法为构建更安全可信的语言模型开辟了新路径。

0

相关内容

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

专知会员服务

23+阅读 · 2025年10月29日

大型语言模型（LLM）赋能的知识图谱构建：综述

大型语言模型（LLM）赋能的知识图谱构建：综述

专知会员服务

54+阅读 · 2025年10月24日

大语言模型与视觉模型中的幻觉现象理解综述

大语言模型与视觉模型中的幻觉现象理解综述

专知会员服务

21+阅读 · 2025年10月2日

融合知识图谱的大语言模型研究综述

融合知识图谱的大语言模型研究综述

专知会员服务

37+阅读 · 2025年4月18日

【ICLR2025】通过自适应对比学习优化大规模语言模型的知识

【ICLR2025】通过自适应对比学习优化大规模语言模型的知识

专知会员服务

18+阅读 · 2025年2月22日

【AAAI2025】通过自适应多方面检索增强，利用大型语言模型进行知识图谱问答

【AAAI2025】通过自适应多方面检索增强，利用大型语言模型进行知识图谱问答

专知会员服务

31+阅读 · 2024年12月26日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

110+阅读 · 2023年12月19日

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

专知会员服务

72+阅读 · 2023年9月7日

如何检测大模型“幻觉”？剑桥提出SelfCheckGPT: 针对生成型大型语言模型的零资源黑盒子幻觉检测

如何检测大模型“幻觉”？剑桥提出SelfCheckGPT: 针对生成型大型语言模型的零资源黑盒子幻觉检测

专知会员服务

43+阅读 · 2023年8月22日

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

专知会员服务

193+阅读 · 2023年6月19日

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

深度学习自然语言处理

31+阅读 · 2020年6月12日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

知识图谱的自动构建

知识图谱的自动构建

DataFunTalk

58+阅读 · 2019年12月9日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

ACL 2019 | AI2等提出自动知识图谱构建模型COMET，接近人类表现

ACL 2019 | AI2等提出自动知识图谱构建模型COMET，接近人类表现

机器之心

18+阅读 · 2019年7月7日

如何独立实现一个基于知识图谱的问答系统

如何独立实现一个基于知识图谱的问答系统

PaperWeekly

11+阅读 · 2019年6月13日

Github六个知识图谱实战项目推荐

Github六个知识图谱实战项目推荐

专知

385+阅读 · 2019年6月2日

【泡泡图灵智库】密集相关的自监督视觉描述学习（RAL）

【泡泡图灵智库】密集相关的自监督视觉描述学习（RAL）

泡泡机器人SLAM

11+阅读 · 2018年10月6日

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

专知

17+阅读 · 2018年6月7日

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

GAN生成式对抗网络

11+阅读 · 2018年6月5日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

Structure Enables Effective Self-Localization of Errors in LLMs

Arxiv

0+阅读 · 2月2日

FaithSCAN: Model-Driven Single-Pass Hallucination Detection for Faithful Visual Question Answering

Arxiv

0+阅读 · 1月28日

HalluGuard: Demystifying Data-Driven and Reasoning-Driven Hallucinations in LLMs

Arxiv

0+阅读 · 1月26日

Beyond Superficial Unlearning: Sharpness-Aware Robust Erasure of Hallucinations in Multimodal LLMs

Arxiv

0+阅读 · 1月23日

Predictive Coding and Information Bottleneck for Hallucination Detection in Large Language Models

Arxiv

0+阅读 · 1月22日

Learned Hallucination Detection in Black-Box LLMs using Token-level Entropy Production Rate

Arxiv

0+阅读 · 1月20日

Bridging External and Parametric Knowledge: Mitigating Hallucination of LLMs with Shared-Private Semantic Synergy in Dual-Stream Knowledge

Bridging External and Parametric Knowledge: Mitigating Hallucination of LLMs with Shared-Private Semantic Synergy in Dual-Stream Knowledge

Arxiv

0+阅读 · 1月9日

Hallucination Detection via Internal States and Structured Reasoning Consistency in Large Language Models

Arxiv

0+阅读 · 1月8日

Understanding New-Knowledge-Induced Factual Hallucinations in LLMs: Analysis and Interpretation

Arxiv

0+阅读 · 1月7日

Heaven-Sent or Hell-Bent? Benchmarking the Intelligence and Defectiveness of LLM Hallucinations

Arxiv

0+阅读 · 2025年12月30日

VIP会员

文章信息

相关主题

相关VIP内容

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

专知会员服务

23+阅读 · 2025年10月29日

大型语言模型（LLM）赋能的知识图谱构建：综述

大型语言模型（LLM）赋能的知识图谱构建：综述

专知会员服务

54+阅读 · 2025年10月24日

大语言模型与视觉模型中的幻觉现象理解综述

大语言模型与视觉模型中的幻觉现象理解综述

专知会员服务

21+阅读 · 2025年10月2日

融合知识图谱的大语言模型研究综述

融合知识图谱的大语言模型研究综述

专知会员服务

37+阅读 · 2025年4月18日

【ICLR2025】通过自适应对比学习优化大规模语言模型的知识

【ICLR2025】通过自适应对比学习优化大规模语言模型的知识

专知会员服务

18+阅读 · 2025年2月22日

【AAAI2025】通过自适应多方面检索增强，利用大型语言模型进行知识图谱问答

【AAAI2025】通过自适应多方面检索增强，利用大型语言模型进行知识图谱问答

专知会员服务

31+阅读 · 2024年12月26日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

110+阅读 · 2023年12月19日

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

专知会员服务

72+阅读 · 2023年9月7日

如何检测大模型“幻觉”？剑桥提出SelfCheckGPT: 针对生成型大型语言模型的零资源黑盒子幻觉检测

如何检测大模型“幻觉”？剑桥提出SelfCheckGPT: 针对生成型大型语言模型的零资源黑盒子幻觉检测

专知会员服务

43+阅读 · 2023年8月22日

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

专知会员服务

193+阅读 · 2023年6月19日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

知识图谱嵌入的Translate模型汇总（TransE，TransH，TransR，TransD）

深度学习自然语言处理

31+阅读 · 2020年6月12日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

知识图谱的自动构建

知识图谱的自动构建

DataFunTalk

58+阅读 · 2019年12月9日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

ACL 2019 | AI2等提出自动知识图谱构建模型COMET，接近人类表现

ACL 2019 | AI2等提出自动知识图谱构建模型COMET，接近人类表现

机器之心

18+阅读 · 2019年7月7日

如何独立实现一个基于知识图谱的问答系统

如何独立实现一个基于知识图谱的问答系统

PaperWeekly

11+阅读 · 2019年6月13日

Github六个知识图谱实战项目推荐

Github六个知识图谱实战项目推荐

专知

385+阅读 · 2019年6月2日

【泡泡图灵智库】密集相关的自监督视觉描述学习（RAL）

【泡泡图灵智库】密集相关的自监督视觉描述学习（RAL）

泡泡机器人SLAM

11+阅读 · 2018年10月6日

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

专知

17+阅读 · 2018年6月7日

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

【学界】谷歌大脑提出自动数据增强方法AutoAugment：可迁移至不同数据集

GAN生成式对抗网络

11+阅读 · 2018年6月5日

相关论文

Structure Enables Effective Self-Localization of Errors in LLMs

Arxiv

0+阅读 · 2月2日

FaithSCAN: Model-Driven Single-Pass Hallucination Detection for Faithful Visual Question Answering

Arxiv

0+阅读 · 1月28日

HalluGuard: Demystifying Data-Driven and Reasoning-Driven Hallucinations in LLMs

Arxiv

0+阅读 · 1月26日

Beyond Superficial Unlearning: Sharpness-Aware Robust Erasure of Hallucinations in Multimodal LLMs

Arxiv

0+阅读 · 1月23日

Predictive Coding and Information Bottleneck for Hallucination Detection in Large Language Models

Arxiv

0+阅读 · 1月22日

Learned Hallucination Detection in Black-Box LLMs using Token-level Entropy Production Rate

Arxiv

0+阅读 · 1月20日

Bridging External and Parametric Knowledge: Mitigating Hallucination of LLMs with Shared-Private Semantic Synergy in Dual-Stream Knowledge

Bridging External and Parametric Knowledge: Mitigating Hallucination of LLMs with Shared-Private Semantic Synergy in Dual-Stream Knowledge

Arxiv

0+阅读 · 1月9日

Hallucination Detection via Internal States and Structured Reasoning Consistency in Large Language Models

Arxiv

0+阅读 · 1月8日

Understanding New-Knowledge-Induced Factual Hallucinations in LLMs: Analysis and Interpretation

Arxiv

0+阅读 · 1月7日

Heaven-Sent or Hell-Bent? Benchmarking the Intelligence and Defectiveness of LLM Hallucinations

Arxiv

0+阅读 · 2025年12月30日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

中文句子语义概念图自动构建方法及应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员