How unique are hallucinated citations offered by generative Artificial Intelligence models? - 专知论文

会员服务 ·

0

参考文献 · 智能模型 · 数据化 · 结构 · AI ·

How unique are hallucinated citations offered by generative Artificial Intelligence models?

翻译：生成式人工智能模型提供的虚假引用的独特性研究

Dirk HR Spennemann

This paper investigates how generative AI produces and propagates hallucinated academic references, focusing on the recurring non-existent citation 'Education Governance and Datafication' attributed to Ben Williamson and Nelli Piattoeva. Drawing on 137 accessible source papers identified through Google Scholar and Google searches, the study analyses the structure, recurrence, and onward citation of this phantom reference. It shows that hallucinated citations are not random inventions but patterned recombinations of real authors, journals, dates, and keywords, with duplication occurring in nearly 30% of cases. The paper also reports a structured interrogation of ChatGPT 5-mini about how it generates citations and finds that, absent verification, the model reconstructs plausible references from learned patterns rather than factual recall. Finally, ten AI-generated essays on datafication and school governance were examined: while most references were genuine or partly accurate, 9.2% remained hallucinated, including an exact match to the most common phantom citation. The findings highlight ongoing risks to academic integrity and show that web-enabled AI still does not fully eliminate fabricated references.

翻译：本文探讨了生成式人工智能如何产生并传播虚假的学术参考文献，重点关注Ben Williamson和Nelli Piattoeva所著且反复出现的虚构引用“教育治理与数据化”。基于通过Google Scholar和Google搜索获取的137篇可访问源文献，本研究分析了该幽灵参考文献的结构、重复出现及其被后续引用的情况。研究表明，虚假引用并非随机编造，而是真实作者、期刊、日期和关键词的模式化重组，近30%的案例存在重复现象。本文还对ChatGPT-5-mini进行了结构化质询，探究其生成引用的机制，发现若缺乏验证环节，模型会基于学习到的模式重构看似可信的引用，而非从事实记忆中提取。最后，本文审阅了十篇关于数据化与学校治理的AI生成论文：尽管大多数引用真实或部分准确，仍有9.2%为虚假引用，其中包括与最常见幽灵引文的完全匹配。研究结果揭示了学术诚信面临的持续风险，并表明具备网络检索能力的AI仍未彻底消除虚构参考文献的问题。

0

相关内容

参考文献

生物信息学中的生成式人工智能：模型、应用与方法学进展的系统性综述

生物信息学中的生成式人工智能：模型、应用与方法学进展的系统性综述

专知会员服务

17+阅读 · 2025年11月10日

【新书】《基于Transformers和扩散模型的生成式人工智能实战》

【新书】《基于Transformers和扩散模型的生成式人工智能实战》

专知会员服务

93+阅读 · 2024年12月16日

生成式人工智能的扩散模型概述

生成式人工智能的扩散模型概述

专知会员服务

66+阅读 · 2024年12月8日

【新书】生成式人工智能模型，419页pdf

【新书】生成式人工智能模型，419页pdf

专知会员服务

121+阅读 · 2024年9月3日

大模型如何遗忘不良知识？最新《生成式人工智能中的机器遗忘》综述

大模型如何遗忘不良知识？最新《生成式人工智能中的机器遗忘》综述

专知会员服务

24+阅读 · 2024年8月1日

视频生成、理解与流媒体的生成式人工智能和大型语言模型综述

视频生成、理解与流媒体的生成式人工智能和大型语言模型综述

专知会员服务

57+阅读 · 2024年4月27日

《综述：生成式人工智能对虚假新闻的影响》

《综述：生成式人工智能对虚假新闻的影响》

专知会员服务

35+阅读 · 2024年4月13日

基于生成式智能体的虚假信息社交网络：研究机遇和开放挑战

基于生成式智能体的虚假信息社交网络：研究机遇和开放挑战

专知会员服务

96+阅读 · 2023年11月1日

生成式人工智能在以色列-哈马斯虚假信息中发挥着令人惊讶的作用

生成式人工智能在以色列-哈马斯虚假信息中发挥着令人惊讶的作用

专知会员服务

62+阅读 · 2023年10月30日

如何用AI技术治理假新闻泛滥？看ASU大学舒凯等学者这篇《挖掘虚假信息和假新闻:概念、方法和最新进展》研究综述

如何用AI技术治理假新闻泛滥？看ASU大学舒凯等学者这篇《挖掘虚假信息和假新闻:概念、方法和最新进展》研究综述

专知会员服务

54+阅读 · 2020年1月11日

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

专知

18+阅读 · 2022年9月3日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

AI可解释性文献列表

AI可解释性文献列表

专知

43+阅读 · 2019年10月7日

GAN新书《生成式深度学习》Generative Deep Learning，附379页全文PDF

GAN新书《生成式深度学习》Generative Deep Learning，附379页全文PDF

专知

96+阅读 · 2019年9月30日

Keras作者推荐的Github项目，基于TensorFlow2的生成式模型合集

Keras作者推荐的Github项目，基于TensorFlow2的生成式模型合集

专知

15+阅读 · 2019年5月17日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

业界 | GAN生成的假脸太逼真了！别怕，十招教你识别AI生成的假图像

业界 | GAN生成的假脸太逼真了！别怕，十招教你识别AI生成的假图像

大数据文摘

15+阅读 · 2018年12月18日

实践 | 如何使用深度学习为照片自动生成文本描述？

实践 | 如何使用深度学习为照片自动生成文本描述？

七月在线实验室

10+阅读 · 2018年5月21日

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

专知

11+阅读 · 2018年3月20日

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

专知

10+阅读 · 2018年3月2日

基于虚拟现实的认知负荷与情绪干扰交互性分析关键技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于同步EEG-fMRI多模态神经影像融合的谎言神经机制研究

国家自然科学基金

0+阅读 · 2017年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

双群体涌现的智能虚拟根系建模与仿真研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

Competition and Diversity in Generative AI

Arxiv

0+阅读 · 6月11日

Generative AI for Managerial Decision-Making under Ambiguity and Sycophancy

Arxiv

0+阅读 · 6月11日

Adoption of Generative Artificial Intelligence in the German Software Engineering Industry: An Empirical Study

Arxiv

0+阅读 · 6月9日

Quantifying Perception-Based Student Success with Generative AI: An Exploratory Monte Carlo Simulation

Arxiv

0+阅读 · 6月9日

The Role of Instructional Guidance in Generative AI-Assisted Learning: Empirical Evidence from Construction Engineering Education

Arxiv

0+阅读 · 6月3日

Synthetic Sources?: Auditing Generative Search Engine Citations for Evidence of AI-Generated Sources

Arxiv

0+阅读 · 5月22日

Distinguishing performance gains from learning when using generative AI

Arxiv

0+阅读 · 5月13日

The Synthetic Media Shift: Tracking the Rise, Virality, and Detectability of AI-Generated Multimodal Misinformation

Arxiv

0+阅读 · 4月15日

Generative Agent-Based Social Networks for Disinformation: Research Opportunities and Open Challenges

Arxiv

57+阅读 · 2023年10月11日

Generative Agents: Interactive Simulacra of Human Behavior

Arxiv

16+阅读 · 2023年8月6日

VIP会员

文章信息

相关主题

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

5+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

4+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

5+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

4+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

6+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

6+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

3+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

5+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

5+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

4+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

3+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

8+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

6+阅读 · 6月16日

相关VIP内容

生物信息学中的生成式人工智能：模型、应用与方法学进展的系统性综述

生物信息学中的生成式人工智能：模型、应用与方法学进展的系统性综述

专知会员服务

17+阅读 · 2025年11月10日

【新书】《基于Transformers和扩散模型的生成式人工智能实战》

【新书】《基于Transformers和扩散模型的生成式人工智能实战》

专知会员服务

93+阅读 · 2024年12月16日

生成式人工智能的扩散模型概述

生成式人工智能的扩散模型概述

专知会员服务

66+阅读 · 2024年12月8日

【新书】生成式人工智能模型，419页pdf

【新书】生成式人工智能模型，419页pdf

专知会员服务

121+阅读 · 2024年9月3日

大模型如何遗忘不良知识？最新《生成式人工智能中的机器遗忘》综述

大模型如何遗忘不良知识？最新《生成式人工智能中的机器遗忘》综述

专知会员服务

24+阅读 · 2024年8月1日

视频生成、理解与流媒体的生成式人工智能和大型语言模型综述

视频生成、理解与流媒体的生成式人工智能和大型语言模型综述

专知会员服务

57+阅读 · 2024年4月27日

《综述：生成式人工智能对虚假新闻的影响》

《综述：生成式人工智能对虚假新闻的影响》

专知会员服务

35+阅读 · 2024年4月13日

基于生成式智能体的虚假信息社交网络：研究机遇和开放挑战

基于生成式智能体的虚假信息社交网络：研究机遇和开放挑战

专知会员服务

96+阅读 · 2023年11月1日

生成式人工智能在以色列-哈马斯虚假信息中发挥着令人惊讶的作用

生成式人工智能在以色列-哈马斯虚假信息中发挥着令人惊讶的作用

专知会员服务

62+阅读 · 2023年10月30日

如何用AI技术治理假新闻泛滥？看ASU大学舒凯等学者这篇《挖掘虚假信息和假新闻:概念、方法和最新进展》研究综述

如何用AI技术治理假新闻泛滥？看ASU大学舒凯等学者这篇《挖掘虚假信息和假新闻:概念、方法和最新进展》研究综述

专知会员服务

54+阅读 · 2020年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

相关资讯

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

专知

18+阅读 · 2022年9月3日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

AI可解释性文献列表

AI可解释性文献列表

专知

43+阅读 · 2019年10月7日

GAN新书《生成式深度学习》Generative Deep Learning，附379页全文PDF

GAN新书《生成式深度学习》Generative Deep Learning，附379页全文PDF

专知

96+阅读 · 2019年9月30日

Keras作者推荐的Github项目，基于TensorFlow2的生成式模型合集

Keras作者推荐的Github项目，基于TensorFlow2的生成式模型合集

专知

15+阅读 · 2019年5月17日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

业界 | GAN生成的假脸太逼真了！别怕，十招教你识别AI生成的假图像

业界 | GAN生成的假脸太逼真了！别怕，十招教你识别AI生成的假图像

大数据文摘

15+阅读 · 2018年12月18日

实践 | 如何使用深度学习为照片自动生成文本描述？

实践 | 如何使用深度学习为照片自动生成文本描述？

七月在线实验室

10+阅读 · 2018年5月21日

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

专知

11+阅读 · 2018年3月20日

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

【论文推荐】最新六篇图像描述生成相关论文—视频摘要、注意力张量积、非自回归神经序列模型、副词识别、多主体、多样性度量

专知

10+阅读 · 2018年3月2日

相关论文

Competition and Diversity in Generative AI

Arxiv

0+阅读 · 6月11日

Generative AI for Managerial Decision-Making under Ambiguity and Sycophancy

Arxiv

0+阅读 · 6月11日

Adoption of Generative Artificial Intelligence in the German Software Engineering Industry: An Empirical Study

Arxiv

0+阅读 · 6月9日

Quantifying Perception-Based Student Success with Generative AI: An Exploratory Monte Carlo Simulation

Arxiv

0+阅读 · 6月9日

The Role of Instructional Guidance in Generative AI-Assisted Learning: Empirical Evidence from Construction Engineering Education

Arxiv

0+阅读 · 6月3日

Synthetic Sources?: Auditing Generative Search Engine Citations for Evidence of AI-Generated Sources

Arxiv

0+阅读 · 5月22日

Distinguishing performance gains from learning when using generative AI

Arxiv

0+阅读 · 5月13日

The Synthetic Media Shift: Tracking the Rise, Virality, and Detectability of AI-Generated Multimodal Misinformation

Arxiv

0+阅读 · 4月15日

Generative Agent-Based Social Networks for Disinformation: Research Opportunities and Open Challenges

Arxiv

57+阅读 · 2023年10月11日

Generative Agents: Interactive Simulacra of Human Behavior

Arxiv

16+阅读 · 2023年8月6日

相关基金

基于虚拟现实的认知负荷与情绪干扰交互性分析关键技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于同步EEG-fMRI多模态神经影像融合的谎言神经机制研究

国家自然科学基金

0+阅读 · 2017年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

双群体涌现的智能虚拟根系建模与仿真研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员