HalluCiteChecker: A Lightweight Toolkit for Hallucinated Citation Detection and Verification in the Era of AI Scientists - 专知论文

会员服务 ·

0

工具 · 审稿 · 科学家 · 笔记本电脑 · 论文 ·

HalluCiteChecker: A Lightweight Toolkit for Hallucinated Citation Detection and Verification in the Era of AI Scientists

翻译：HalluCiteChecker：人工智能科学家时代幻觉引用检测与验证的轻量级工具包

Yusuke Sakai,Hidetaka Kamigaito,Taro Watanabe

from arxiv, Work In Progress

We introduce HalluCiteChecker, a toolkit for detecting and verifying hallucinated citations in scientific papers. While AI assistant technologies have transformed the academic writing process, including citation recommendation, they have also led to the emergence of hallucinated citations that do not correspond to any existing work. Such citations not only undermine the credibility of scientific papers but also impose an additional burden on reviewers and authors, who must manually verify their validity during the review process. In this study, we formalize hallucinated citation detection as an NLP task and provide a corresponding toolkit as a practical foundation for addressing this problem. Our package is lightweight and can perform verification in seconds on a standard laptop. It can also be executed entirely offline and runs efficiently using only CPUs. We hope that HalluCiteChecker will help reduce reviewer workload and support organizers by enabling systematic pre-review and publication checks. Our code is released under the Apache 2.0 license on GitHub and is distributed as an installable package via PyPI. A demonstration video is available on YouTube.

翻译：我们提出HalluCiteChecker，一个用于检测和验证科学论文中幻觉引用的工具包。尽管AI辅助技术已经转变了学术写作流程（包括引用推荐），但它们也导致了与任何现有工作不对应的幻觉引用的出现。此类引用不仅削弱了科学论文的可信度，还给审稿人和作者带来了额外负担——他们必须在审稿过程中手动验证引用的真实性。在本研究中，我们将幻觉引用的检测形式化为一个自然语言处理任务，并提供一个相应的工具包作为解决该问题的实用基础。我们的软件包轻量高效，可在标准笔记本电脑上数秒内完成验证；同时支持完全离线运行，且仅使用CPU即可高效执行。我们希望HalluCiteChecker能通过实现系统化的预审和出版前检查，减轻审稿人工作负担并支持会议组织者。我们的代码已基于Apache 2.0许可证在GitHub上公开发布，同时可通过PyPI作为可安装包分发。配套演示视频已在YouTube上线。

0

相关内容

PaperOrchestra：一种面向自动化 AI 学术论文撰写的多智能体框架

PaperOrchestra：一种面向自动化 AI 学术论文撰写的多智能体框架

专知会员服务

13+阅读 · 4月9日

【NeurIPS 2024】HaloScope：利用未标记的大型语言模型生成进行幻觉检测

【NeurIPS 2024】HaloScope：利用未标记的大型语言模型生成进行幻觉检测

专知会员服务

20+阅读 · 2024年9月27日

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

专知会员服务

36+阅读 · 2024年8月11日

《大型视觉语言模型中的幻觉现象》综述

《大型视觉语言模型中的幻觉现象》综述

专知会员服务

57+阅读 · 2024年2月2日

科研动态| 不依赖GPT-4的多模态幻觉评估benchmark来了！一键实现多维度幻觉自动分析

科研动态| 不依赖GPT-4的多模态幻觉评估benchmark来了！一键实现多维度幻觉自动分析

专知会员服务

26+阅读 · 2023年11月15日

大模型的幻觉现象介绍

大模型的幻觉现象介绍

专知会员服务

66+阅读 · 2023年10月27日

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

专知会员服务

72+阅读 · 2023年9月7日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

71+阅读 · 2020年1月17日

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

专知会员服务

32+阅读 · 2019年10月25日

Diffusion的火，只是AIGC的缩影 | 量子位智库报告（附下载）

Diffusion的火，只是AIGC的缩影 | 量子位智库报告（附下载）

量子位

10+阅读 · 2022年9月22日

CALDERA 一款对手自动模拟工具

CALDERA 一款对手自动模拟工具

黑白之道

20+阅读 · 2019年9月17日

Kaldi拜拜！PyTorch语音工具包SpeechBrain要来了，支持多种语音任务，实现最强水准

Kaldi拜拜！PyTorch语音工具包SpeechBrain要来了，支持多种语音任务，实现最强水准

量子位

10+阅读 · 2019年9月12日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

专知

25+阅读 · 2018年11月25日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

AI研习社

10+阅读 · 2018年3月6日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

量子导引的判定、度量与几何表示

国家自然科学基金

1+阅读 · 2017年12月31日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

多重假设检验中的k-FWER控制

国家自然科学基金

0+阅读 · 2015年12月31日

三维谐振腔Transmon中的量子门操控和量子模拟

国家自然科学基金

0+阅读 · 2015年12月31日

时空线索在舰载机飞行员黑洞错觉中的作用机制

国家自然科学基金

2+阅读 · 2015年12月31日

在线检测工件表面质量的“透明窗”方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向可穿戴设备的压缩感知关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

具有噪声容忍度的量子测量方案研究

国家自然科学基金

0+阅读 · 2015年12月31日

高纯锗探测器暗物质年度调制效应和轴子暗物质的实验研究

国家自然科学基金

0+阅读 · 2015年12月31日

有噪声纠缠比特的纠缠辅助量子纠错码研究

国家自然科学基金

0+阅读 · 2014年12月31日

Mechanisms of Prompt-Induced Hallucination in Vision-Language Models

Arxiv

0+阅读 · 4月17日

WisPaper: Your AI Scholar Search Engine

Arxiv

0+阅读 · 4月13日

Hallucination Detection and Evaluation of Large Language Model

Arxiv

0+阅读 · 4月9日

HaloProbe: Bayesian Detection and Mitigation of Object Hallucinations in Vision-Language Models

Arxiv

0+阅读 · 4月7日

Beyond the Global Scores: Fine-Grained Token Grounding as a Robust Detector of LVLM Hallucinations

Arxiv

0+阅读 · 4月6日

Detecting and Correcting Reference Hallucinations in Commercial LLMs and Deep Research Agents

Arxiv

0+阅读 · 4月3日

UnrealVis: A Testing Laboratory of Optimization Techniques in Unreal Engine for Scientific Visualization

Arxiv

0+阅读 · 4月3日

FACTUM: Mechanistic Detection of Citation Hallucination in Long-Form RAG

Arxiv

0+阅读 · 3月29日

MARCH: Multi-Agent Reinforced Self-Check for LLM Hallucination

Arxiv

0+阅读 · 3月25日

HalDec-Bench: Benchmarking Hallucination Detector in Image Captioning

Arxiv

0+阅读 · 3月24日

VIP会员

文章信息

相关主题

笔记本电脑

最新内容

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

0+阅读 · 6分钟前

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

1+阅读 · 18分钟前

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

1+阅读 · 29分钟前

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

1+阅读 · 38分钟前

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

1+阅读 · 42分钟前

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

1+阅读 · 46分钟前

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

1+阅读 · 50分钟前

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

相关VIP内容

PaperOrchestra：一种面向自动化 AI 学术论文撰写的多智能体框架

PaperOrchestra：一种面向自动化 AI 学术论文撰写的多智能体框架

专知会员服务

13+阅读 · 4月9日

【NeurIPS 2024】HaloScope：利用未标记的大型语言模型生成进行幻觉检测

【NeurIPS 2024】HaloScope：利用未标记的大型语言模型生成进行幻觉检测

专知会员服务

20+阅读 · 2024年9月27日

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

专知会员服务

36+阅读 · 2024年8月11日

《大型视觉语言模型中的幻觉现象》综述

《大型视觉语言模型中的幻觉现象》综述

专知会员服务

57+阅读 · 2024年2月2日

科研动态| 不依赖GPT-4的多模态幻觉评估benchmark来了！一键实现多维度幻觉自动分析

科研动态| 不依赖GPT-4的多模态幻觉评估benchmark来了！一键实现多维度幻觉自动分析

专知会员服务

26+阅读 · 2023年11月15日

大模型的幻觉现象介绍

大模型的幻觉现象介绍

专知会员服务

66+阅读 · 2023年10月27日

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

大模型的“幻觉”如何克服？腾讯AILab等《大型语言模型中的幻觉》，全面阐述检测、解释和减轻幻觉

专知会员服务

72+阅读 · 2023年9月7日

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

【干货书】深度伪造 (DeepFakes):创造，检测和影响，167页pdf

专知会员服务

69+阅读 · 2022年8月1日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

71+阅读 · 2020年1月17日

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

专知会员服务

32+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

美以伊冲突：无人机与人工智能的运用

《特种部队在透明战场中的生存力》最新报告

相关资讯

Diffusion的火，只是AIGC的缩影 | 量子位智库报告（附下载）

Diffusion的火，只是AIGC的缩影 | 量子位智库报告（附下载）

量子位

10+阅读 · 2022年9月22日

CALDERA 一款对手自动模拟工具

CALDERA 一款对手自动模拟工具

黑白之道

20+阅读 · 2019年9月17日

Kaldi拜拜！PyTorch语音工具包SpeechBrain要来了，支持多种语音任务，实现最强水准

Kaldi拜拜！PyTorch语音工具包SpeechBrain要来了，支持多种语音任务，实现最强水准

量子位

10+阅读 · 2019年9月12日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

【干货|如何打开黑盒子模型？】41页最新机器学习可解释模型综述论文，143篇参考文献，2300次下载

专知

25+阅读 · 2018年11月25日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

Github 项目推荐 | 真实全景图像强化学习 AI 平台 —— Matterport3DSimulator

AI研习社

10+阅读 · 2018年3月6日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

相关论文

Mechanisms of Prompt-Induced Hallucination in Vision-Language Models

Arxiv

0+阅读 · 4月17日

WisPaper: Your AI Scholar Search Engine

Arxiv

0+阅读 · 4月13日

Hallucination Detection and Evaluation of Large Language Model

Arxiv

0+阅读 · 4月9日

HaloProbe: Bayesian Detection and Mitigation of Object Hallucinations in Vision-Language Models

Arxiv

0+阅读 · 4月7日

Beyond the Global Scores: Fine-Grained Token Grounding as a Robust Detector of LVLM Hallucinations

Arxiv

0+阅读 · 4月6日

Detecting and Correcting Reference Hallucinations in Commercial LLMs and Deep Research Agents

Arxiv

0+阅读 · 4月3日

UnrealVis: A Testing Laboratory of Optimization Techniques in Unreal Engine for Scientific Visualization

Arxiv

0+阅读 · 4月3日

FACTUM: Mechanistic Detection of Citation Hallucination in Long-Form RAG

Arxiv

0+阅读 · 3月29日

MARCH: Multi-Agent Reinforced Self-Check for LLM Hallucination

Arxiv

0+阅读 · 3月25日

HalDec-Bench: Benchmarking Hallucination Detector in Image Captioning

Arxiv

0+阅读 · 3月24日

相关基金

量子导引的判定、度量与几何表示

国家自然科学基金

1+阅读 · 2017年12月31日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

多重假设检验中的k-FWER控制

国家自然科学基金

0+阅读 · 2015年12月31日

三维谐振腔Transmon中的量子门操控和量子模拟

国家自然科学基金

0+阅读 · 2015年12月31日

时空线索在舰载机飞行员黑洞错觉中的作用机制

国家自然科学基金

2+阅读 · 2015年12月31日

在线检测工件表面质量的“透明窗”方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向可穿戴设备的压缩感知关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

具有噪声容忍度的量子测量方案研究

国家自然科学基金

0+阅读 · 2015年12月31日

高纯锗探测器暗物质年度调制效应和轴子暗物质的实验研究

国家自然科学基金

0+阅读 · 2015年12月31日

有噪声纠缠比特的纠缠辅助量子纠错码研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员