BibAgent: An Agentic Framework for Traceable Miscitation Detection in Scientific Literature - 专知论文

会员服务 ·

0

参考文献 · 系统 · 包含 · 自动化 · 数据集 ·

BibAgent: An Agentic Framework for Traceable Miscitation Detection in Scientific Literature

翻译：BibAgent：一种用于科学文献中可追溯误引检测的智能体框架

Peiran Li,Fangzhou Lin,Shuo Xing,Xiang Zheng,Xi Hong,Jiashuo Sun,Zhengzhong Tu,Chaoqun Ni

Citations are the bedrock of scientific authority, yet their integrity is compromised by widespread miscitations: ranging from nuanced distortions to fabricated references. Systematic citation verification is currently unfeasible; manual review cannot scale to modern publishing volumes, while existing automated tools are restricted by abstract-only analysis or small-scale, domain-specific datasets in part due to the "paywall barrier" of full-text access. We introduce BibAgent, a scalable, end-to-end agentic framework for automated citation verification. BibAgent integrates retrieval, reasoning, and adaptive evidence aggregation, applying distinct strategies for accessible and paywalled sources. For paywalled references, it leverages a novel Evidence Committee mechanism that infers citation validity via downstream citation consensus. To support systematic evaluation, we contribute a 5-category Miscitation Taxonomy and MisciteBench, a massive cross-disciplinary benchmark comprising 6,350 miscitation samples spanning 254 fields. Our results demonstrate that BibAgent outperforms state-of-the-art Large Language Model (LLM) baselines in citation verification accuracy and interpretability, providing scalable, transparent detection of citation misalignments across the scientific literature.

翻译：引文是科学权威的基石，然而其完整性因广泛存在的误引现象而受到损害：从细微的扭曲到捏造的参考文献。系统性的引文验证目前尚不可行；人工审核无法扩展到现代出版规模，而现有的自动化工具受限于仅能分析摘要或使用小规模、特定领域的数据集，部分原因在于全文访问的“付费墙障碍”。我们提出了BibAgent，一个可扩展的端到端智能体框架，用于自动化引文验证。BibAgent集成了检索、推理和自适应证据聚合，针对可访问资源和付费墙资源应用不同的策略。对于付费墙参考文献，它利用一种新颖的证据委员会机制，通过下游引文共识推断引文有效性。为支持系统性评估，我们贡献了一个包含5个类别的误引分类法以及MisciteBench——一个大规模跨学科基准数据集，包含涵盖254个领域的6,350个误引样本。我们的结果表明，BibAgent在引文验证准确性和可解释性方面优于最先进的大型语言模型基线，为科学文献中的引文失准提供了可扩展、透明的检测方法。

0

相关内容

参考文献

智能体工程（Agent Engineering）

智能体工程（Agent Engineering）

专知会员服务

38+阅读 · 2025年12月31日

【斯坦福博士论文】数据、决策与过度依赖：构建可信人工智能的核心挑战

【斯坦福博士论文】数据、决策与过度依赖：构建可信人工智能的核心挑战

专知会员服务

38+阅读 · 2025年12月28日

【ETHZ博士论文】设计与分析：一种面向极大规模、高性能、模块化的智能体仿真平台

【ETHZ博士论文】设计与分析：一种面向极大规模、高性能、模块化的智能体仿真平台

专知会员服务

31+阅读 · 2025年3月17日

谷歌《智能体Agent》白皮书，42页pdf

谷歌《智能体Agent》白皮书，42页pdf

专知会员服务

108+阅读 · 2025年1月5日

【博士论文】《评估、创建和使用知识图谱的限制》2022最新230页博士论文，根特大学

【博士论文】《评估、创建和使用知识图谱的限制》2022最新230页博士论文，根特大学

专知会员服务

40+阅读 · 2022年8月8日

AI系统如何可信？CMU-Nicholas博士论文《以模型为中心的人工智能验证》200页阐述增强AI系统信任度以确保安全部署运行

AI系统如何可信？CMU-Nicholas博士论文《以模型为中心的人工智能验证》200页阐述增强AI系统信任度以确保安全部署运行

专知会员服务

68+阅读 · 2022年1月27日

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

专知会员服务

108+阅读 · 2021年10月6日

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

专知会员服务

48+阅读 · 2020年8月8日

【推荐论文】可解释知识使能系统基础，26页pdf，Foundations of Explainable Knowledge-Enabled Systems

【推荐论文】可解释知识使能系统基础，26页pdf，Foundations of Explainable Knowledge-Enabled Systems

专知会员服务

34+阅读 · 2020年3月18日

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

专知会员服务

32+阅读 · 2019年10月25日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

AI可解释性文献列表

AI可解释性文献列表

专知

43+阅读 · 2019年10月7日

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

AI100

17+阅读 · 2019年9月14日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

专知

11+阅读 · 2019年2月8日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

专知

17+阅读 · 2018年6月16日

干货｜当深度学习遇见自动文本摘要，seq2seq+attention

干货｜当深度学习遇见自动文本摘要，seq2seq+attention

机器学习算法与Python学习

10+阅读 · 2018年5月28日

如何用人工智能帮你找论文？

如何用人工智能帮你找论文？

AI100

10+阅读 · 2018年2月21日

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

产业智能官

11+阅读 · 2018年1月6日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

基于跨媒体可视分析的三维对象关联检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

DIAGPaper: Diagnosing Valid and Specific Weaknesses in Scientific Papers via Multi-Agent Reasoning

Arxiv

0+阅读 · 2月18日

Anagent For Enhancing Scientific Table & Figure Analysis

Arxiv

0+阅读 · 2月12日

Anagent For Enhancing Scientific Table & Figure Analysis

Arxiv

0+阅读 · 2月10日

FlyAOC: Evaluating Agentic Ontology Curation of Drosophila Scientific Knowledge Bases

Arxiv

0+阅读 · 2月9日

SciDataCopilot: An Agentic Data Preparation Framework for AGI-driven Scientific Discovery

Arxiv

0+阅读 · 2月9日

BioACE: An Automated Framework for Biomedical Answer and Citation Evaluations

Arxiv

0+阅读 · 2月6日

BibAgent: An Agentic Framework for Traceable Miscitation Detection in Scientific Literature

Arxiv

0+阅读 · 1月30日

Paper2Rebuttal: A Multi-Agent Framework for Transparent Author Response Assistance

Arxiv

0+阅读 · 1月20日

ManipShield: A Unified Framework for Image Manipulation Detection, Localization and Explanation

Arxiv

0+阅读 · 1月19日

DepRadar: Agentic Coordination for Context Aware Defect Impact Analysis in Deep Learning Libraries

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

最新内容

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

1+阅读 · 12分钟前

《异构人类团队的协作决策过程混合建模研究》

《异构人类团队的协作决策过程混合建模研究》

专知会员服务

2+阅读 · 17分钟前

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

专知会员服务

2+阅读 · 20分钟前

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

专知会员服务

2+阅读 · 26分钟前

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

2+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

3+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

11+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

7+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

6+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

4+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

10+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

6+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

9+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

11+阅读 · 7月26日

相关VIP内容

智能体工程（Agent Engineering）

智能体工程（Agent Engineering）

专知会员服务

38+阅读 · 2025年12月31日

【斯坦福博士论文】数据、决策与过度依赖：构建可信人工智能的核心挑战

【斯坦福博士论文】数据、决策与过度依赖：构建可信人工智能的核心挑战

专知会员服务

38+阅读 · 2025年12月28日

【ETHZ博士论文】设计与分析：一种面向极大规模、高性能、模块化的智能体仿真平台

【ETHZ博士论文】设计与分析：一种面向极大规模、高性能、模块化的智能体仿真平台

专知会员服务

31+阅读 · 2025年3月17日

谷歌《智能体Agent》白皮书，42页pdf

谷歌《智能体Agent》白皮书，42页pdf

专知会员服务

108+阅读 · 2025年1月5日

【博士论文】《评估、创建和使用知识图谱的限制》2022最新230页博士论文，根特大学

【博士论文】《评估、创建和使用知识图谱的限制》2022最新230页博士论文，根特大学

专知会员服务

40+阅读 · 2022年8月8日

AI系统如何可信？CMU-Nicholas博士论文《以模型为中心的人工智能验证》200页阐述增强AI系统信任度以确保安全部署运行

AI系统如何可信？CMU-Nicholas博士论文《以模型为中心的人工智能验证》200页阐述增强AI系统信任度以确保安全部署运行

专知会员服务

68+阅读 · 2022年1月27日

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

京东等学者发布《可信赖人工智能》综述论文，62页pdf449篇文献全面阐述可信赖AI的理论与方法

专知会员服务

108+阅读 · 2021年10月6日

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

专知会员服务

48+阅读 · 2020年8月8日

【推荐论文】可解释知识使能系统基础，26页pdf，Foundations of Explainable Knowledge-Enabled Systems

【推荐论文】可解释知识使能系统基础，26页pdf，Foundations of Explainable Knowledge-Enabled Systems

专知会员服务

34+阅读 · 2020年3月18日

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

专知会员服务

32+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

博士论文 | 面向大模型推理的内存高效算法

《异构人类团队的协作决策过程混合建模研究》

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

相关资讯

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

AI可解释性文献列表

AI可解释性文献列表

专知

43+阅读 · 2019年10月7日

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

AI100

17+阅读 · 2019年9月14日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

专知

11+阅读 · 2019年2月8日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

专知

17+阅读 · 2018年6月16日

干货｜当深度学习遇见自动文本摘要，seq2seq+attention

干货｜当深度学习遇见自动文本摘要，seq2seq+attention

机器学习算法与Python学习

10+阅读 · 2018年5月28日

如何用人工智能帮你找论文？

如何用人工智能帮你找论文？

AI100

10+阅读 · 2018年2月21日

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

产业智能官

11+阅读 · 2018年1月6日

相关论文

DIAGPaper: Diagnosing Valid and Specific Weaknesses in Scientific Papers via Multi-Agent Reasoning

Arxiv

0+阅读 · 2月18日

Anagent For Enhancing Scientific Table & Figure Analysis

Arxiv

0+阅读 · 2月12日

Anagent For Enhancing Scientific Table & Figure Analysis

Arxiv

0+阅读 · 2月10日

FlyAOC: Evaluating Agentic Ontology Curation of Drosophila Scientific Knowledge Bases

Arxiv

0+阅读 · 2月9日

SciDataCopilot: An Agentic Data Preparation Framework for AGI-driven Scientific Discovery

Arxiv

0+阅读 · 2月9日

BioACE: An Automated Framework for Biomedical Answer and Citation Evaluations

Arxiv

0+阅读 · 2月6日

BibAgent: An Agentic Framework for Traceable Miscitation Detection in Scientific Literature

Arxiv

0+阅读 · 1月30日

Paper2Rebuttal: A Multi-Agent Framework for Transparent Author Response Assistance

Arxiv

0+阅读 · 1月20日

ManipShield: A Unified Framework for Image Manipulation Detection, Localization and Explanation

Arxiv

0+阅读 · 1月19日

DepRadar: Agentic Coordination for Context Aware Defect Impact Analysis in Deep Learning Libraries

Arxiv

0+阅读 · 1月14日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

基于跨媒体可视分析的三维对象关联检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员