统一幻觉定义：关键在于世界模型！ (A Unified Definition of Hallucination: It's The World Model, Stupid!) - 专知论文

会员服务 ·

0

世界模型 · 基准 · 语言模型 · 知识 · 变换 ·

A Unified Definition of Hallucination: It's The World Model, Stupid!

翻译：统一幻觉定义：关键在于世界模型！

Emmy Liu,Varun Gangal,Chelsea Zou,Michael Yu,Xiaoqi Huang,Alex Chang,Zhuofu Tao,Karan Singh,Sachin Kumar,Steven Y. Feng

from arxiv, HalluWorld benchmark in progress. Repo at https://github.com/DegenAI-Labs/HalluWorld

Despite numerous attempts at mitigation since the inception of language models, hallucinations remain a persistent problem even in today's frontier LLMs. Why is this? We review existing definitions of hallucination and fold them into a single, unified definition wherein prior definitions are subsumed. We argue that hallucination can be unified by defining it as simply inaccurate (internal) world modeling, in a form where it is observable to the user. For example, stating a fact which contradicts a knowledge base OR producing a summary which contradicts the source. By varying the reference world model and conflict policy, our framework unifies prior definitions. We argue that this unified view is useful because it forces evaluations to clarify their assumed reference "world", distinguishes true hallucinations from planning or reward errors, and provides a common language for comparison across benchmarks and discussion of mitigation strategies. Building on this definition, we outline plans for a family of benchmarks using synthetic, fully specified reference world models to stress-test and improve world modeling components.

翻译：自语言模型诞生以来，尽管已有众多缓解尝试，幻觉问题在当今前沿大语言模型中依然顽固存在。原因何在？本文梳理了现有幻觉定义，并将其整合为一个统一框架，使先前定义成为其特例。我们认为，幻觉可通过定义为“用户可观察到的、不准确的（内部）世界建模”而实现统一。例如：陈述与知识库相悖的事实，或生成与源材料矛盾的摘要。通过变换参照世界模型与冲突判定策略，本框架统一了既往定义。这一统一定义具有三重价值：迫使评估方案澄清其预设的参照“世界”，区分真实幻觉与规划/奖励误差，并为跨基准比较及缓解策略讨论提供共同话语体系。基于此定义，我们规划构建一系列使用合成化、全参数化参照世界模型的基准测试，以压力测试并改进世界建模组件。

0

相关内容

世界模型

大语言模型与视觉模型中的幻觉现象理解综述

大语言模型与视觉模型中的幻觉现象理解综述

专知会员服务

21+阅读 · 2025年10月2日

大型视觉语言模型中幻觉现象的综述

大型视觉语言模型中幻觉现象的综述

专知会员服务

47+阅读 · 2024年10月24日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

《多模态大型语言模型的幻觉现象》综述

《多模态大型语言模型的幻觉现象》综述

专知会员服务

46+阅读 · 2024年4月30日

大型语言模型幻觉的综述

大型语言模型幻觉的综述

专知会员服务

39+阅读 · 2024年2月15日

《大型视觉语言模型中的幻觉现象》综述

《大型视觉语言模型中的幻觉现象》综述

专知会员服务

57+阅读 · 2024年2月2日

大模型幻觉如何克服？哈工大等最新《大型语言模型中的幻觉现象》综述，详述原理、分类、挑战与未解之谜

大模型幻觉如何克服？哈工大等最新《大型语言模型中的幻觉现象》综述，详述原理、分类、挑战与未解之谜

专知会员服务

82+阅读 · 2023年11月12日

大模型的幻觉现象介绍

大模型的幻觉现象介绍

专知会员服务

66+阅读 · 2023年10月27日

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

专知会员服务

72+阅读 · 2023年9月7日

多模态大模型的幻觉问题与评估

多模态大模型的幻觉问题与评估

专知会员服务

57+阅读 · 2023年7月28日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

【数字孪生】关于数字孪生的冷思考及其背后的建模和仿真技术

【数字孪生】关于数字孪生的冷思考及其背后的建模和仿真技术

产业智能官

25+阅读 · 2020年3月5日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

基于模型系统的系统设计

基于模型系统的系统设计

科技导报

10+阅读 · 2019年4月25日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于正交级数展开的多体系统混合不确定性研究

国家自然科学基金

1+阅读 · 2015年12月31日

不同加工层次和不同时空尺度下无意识加工之间的相互作用

国家自然科学基金

0+阅读 · 2015年12月31日

视觉质量感知的脑电时空特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于信息密度的广义不确定直觉模糊集成算子及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

网络的小世界结构及其上随机游动的混合时

国家自然科学基金

1+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

A Geometric Analysis of Small-sized Language Model Hallucinations

Arxiv

0+阅读 · 2月16日

SAKED: Mitigating Hallucination in Large Vision-Language Models via Stability-Aware Knowledge Enhanced Decoding

Arxiv

0+阅读 · 2月10日

From Out-of-Distribution Detection to Hallucination Detection: A Geometric View

Arxiv

0+阅读 · 2月6日

Halluverse-M^3: A multitask multilingual benchmark for hallucination in LLMs

Arxiv

0+阅读 · 2月6日

Once Correct, Still Wrong: Counterfactual Hallucination in Multilingual Vision-Language Models

Arxiv

0+阅读 · 2月5日

KVSmooth: Mitigating Hallucination in Multi-modal Large Language Models through Key-Value Smoothing

Arxiv

0+阅读 · 2月4日

Do I Really Know? Learning Factual Self-Verification for Hallucination Reduction

Arxiv

0+阅读 · 2月2日

FaithSCAN: Model-Driven Single-Pass Hallucination Detection for Faithful Visual Question Answering

Arxiv

0+阅读 · 1月28日

HalluGuard: Demystifying Data-Driven and Reasoning-Driven Hallucinations in LLMs

Arxiv

0+阅读 · 1月26日

Relational Linearity is a Predictor of Hallucinations

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

相关VIP内容

大语言模型与视觉模型中的幻觉现象理解综述

大语言模型与视觉模型中的幻觉现象理解综述

专知会员服务

21+阅读 · 2025年10月2日

大型视觉语言模型中幻觉现象的综述

大型视觉语言模型中幻觉现象的综述

专知会员服务

47+阅读 · 2024年10月24日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

《多模态大型语言模型的幻觉现象》综述

《多模态大型语言模型的幻觉现象》综述

专知会员服务

46+阅读 · 2024年4月30日

大型语言模型幻觉的综述

大型语言模型幻觉的综述

专知会员服务

39+阅读 · 2024年2月15日

《大型视觉语言模型中的幻觉现象》综述

《大型视觉语言模型中的幻觉现象》综述

专知会员服务

57+阅读 · 2024年2月2日

大模型幻觉如何克服？哈工大等最新《大型语言模型中的幻觉现象》综述，详述原理、分类、挑战与未解之谜

大模型幻觉如何克服？哈工大等最新《大型语言模型中的幻觉现象》综述，详述原理、分类、挑战与未解之谜

专知会员服务

82+阅读 · 2023年11月12日

大模型的幻觉现象介绍

大模型的幻觉现象介绍

专知会员服务

66+阅读 · 2023年10月27日

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

专知会员服务

72+阅读 · 2023年9月7日

多模态大模型的幻觉问题与评估

多模态大模型的幻觉问题与评估

专知会员服务

57+阅读 · 2023年7月28日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

【数字孪生】关于数字孪生的冷思考及其背后的建模和仿真技术

【数字孪生】关于数字孪生的冷思考及其背后的建模和仿真技术

产业智能官

25+阅读 · 2020年3月5日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

基于模型系统的系统设计

基于模型系统的系统设计

科技导报

10+阅读 · 2019年4月25日

【机器学习】深入剖析机器学习中的统计思想

【机器学习】深入剖析机器学习中的统计思想

产业智能官

17+阅读 · 2019年1月24日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

相关论文

A Geometric Analysis of Small-sized Language Model Hallucinations

Arxiv

0+阅读 · 2月16日

SAKED: Mitigating Hallucination in Large Vision-Language Models via Stability-Aware Knowledge Enhanced Decoding

Arxiv

0+阅读 · 2月10日

From Out-of-Distribution Detection to Hallucination Detection: A Geometric View

Arxiv

0+阅读 · 2月6日

Halluverse-M^3: A multitask multilingual benchmark for hallucination in LLMs

Arxiv

0+阅读 · 2月6日

Once Correct, Still Wrong: Counterfactual Hallucination in Multilingual Vision-Language Models

Arxiv

0+阅读 · 2月5日

KVSmooth: Mitigating Hallucination in Multi-modal Large Language Models through Key-Value Smoothing

Arxiv

0+阅读 · 2月4日

Do I Really Know? Learning Factual Self-Verification for Hallucination Reduction

Arxiv

0+阅读 · 2月2日

FaithSCAN: Model-Driven Single-Pass Hallucination Detection for Faithful Visual Question Answering

Arxiv

0+阅读 · 1月28日

HalluGuard: Demystifying Data-Driven and Reasoning-Driven Hallucinations in LLMs

Arxiv

0+阅读 · 1月26日

Relational Linearity is a Predictor of Hallucinations

Arxiv

0+阅读 · 1月16日

相关基金

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于正交级数展开的多体系统混合不确定性研究

国家自然科学基金

1+阅读 · 2015年12月31日

不同加工层次和不同时空尺度下无意识加工之间的相互作用

国家自然科学基金

0+阅读 · 2015年12月31日

视觉质量感知的脑电时空特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于信息密度的广义不确定直觉模糊集成算子及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

网络的小世界结构及其上随机游动的混合时

国家自然科学基金

1+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员