Are We Truly Innovating? A Qualitative and Quantitative Study of Originality in AI Research Papers - 专知论文

会员服务 ·

0

原点 · AI · MoDELS · 论文 · Analysis ·

Are We Truly Innovating? A Qualitative and Quantitative Study of Originality in AI Research Papers

翻译：我们真的在创新吗？——AI研究论文原创性的定性与定量研究

Abeer Mostafa,Thi Huyen Nguyen,Zahra Ahmadi

Assessing originality in AI research is arguably the most consequential yet least reliable step in peer review. Reviewer judgments of originality remain opaque, inconsistent, and dependent on comparisons to prior work that are often incomplete. In this paper, we present a large-scale, data-driven qualitative and quantitative analysis of research originality based on over 100,000 peer-review reports from leading AI venues, spanning a period of rapid growth in the field. Leveraging structured, semantically retrieved prior work and signals embedded in expert reviewer assessments, we systematically characterize how originality is perceived in practice and identify the key dimensions that most strongly influence novelty judgments. Our analysis yields a fine-grained, evidence-based framework that equips both authors and reviewers with actionable insights into how originality is evaluated. In addition, we evaluate the reliability of current large language model (LLM) agents in assessing originality. We find that these models tend to systematically overestimate novelty and struggle to detect conceptual plagiarism, particularly in the presence of paraphrasing. We release our dataset, trained models, and code at: https://anonymous.4open.science/r/Novelty-Reviewer-365C/.

翻译：评估AI研究的原创性，或许是同行评审中最重要却最不可靠的环节。审稿人对原创性的判断往往不透明、不一致，且依赖于对过往工作的对比，而这种对比常常不完整。本文基于来自顶级AI学术会议的超10万份同行评审报告，对研究原创性进行了大规模、数据驱动的定性与定量分析，覆盖了该领域快速发展的时期。通过利用结构化、语义检索的已有工作，以及嵌入在专家审稿人评估中的信号，我们系统地描述了实践中原创性是如何被感知的，并识别出对新颖性判断影响最强的关键维度。我们的分析构建了一个细粒度、基于证据的框架，为作者和审稿人提供了关于原创性如何被评估的可操作见解。此外，我们还评估了当前大语言模型（LLM）智能体在评估原创性方面的可靠性。我们发现，这些模型倾向于系统性地高估新颖性，且在检测概念抄袭方面存在困难，尤其是在存在释义改写的情况下。我们将数据集、训练模型及代码发布在：https://anonymous.4open.science/r/Novelty-Reviewer-365C/。

0

相关内容

Nature杂志《AI科学家诞生：从构思到论文发表，全程无需人类插手》

Nature杂志《AI科学家诞生：从构思到论文发表，全程无需人类插手》

专知会员服务

27+阅读 · 3月28日

从Idea构想到论文发表：AI for Research全链路综述与实践

从Idea构想到论文发表：AI for Research全链路综述与实践

专知会员服务

25+阅读 · 2025年7月21日

AI4Research：科学研究中的人工智能综述

AI4Research：科学研究中的人工智能综述

专知会员服务

38+阅读 · 2025年7月4日

《AI生成视频评估综述》

《AI生成视频评估综述》

专知会员服务

28+阅读 · 2024年10月30日

【ICML2024】量化稳定扩散中的原创性

【ICML2024】量化稳定扩散中的原创性

专知会员服务

17+阅读 · 2024年8月18日

《负责任人工智能：概念、批判观点和信息系统研究议程》2022.12最新论文，挪威科技大学等

《负责任人工智能：概念、批判观点和信息系统研究议程》2022.12最新论文，挪威科技大学等

专知会员服务

26+阅读 · 2023年1月18日

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

专知会员服务

52+阅读 · 2022年8月24日

可信AI是什么？密歇根最新WWW2022《可信人工智能：一种计算视角》教程，附123页ppt

可信AI是什么？密歇根最新WWW2022《可信人工智能：一种计算视角》教程，附123页ppt

专知会员服务

90+阅读 · 2022年4月29日

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

专知会员服务

48+阅读 · 2020年8月8日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

41+阅读 · 2020年1月13日

AAAI,ICML,CVPR,NeurIPS...31篇国际七大AI顶会2021年度Best Papers 一文回顾

AAAI,ICML,CVPR,NeurIPS...31篇国际七大AI顶会2021年度Best Papers 一文回顾

机器之心

14+阅读 · 2022年2月5日

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知

24+阅读 · 2019年12月1日

AI可解释性文献列表

AI可解释性文献列表

专知

43+阅读 · 2019年10月7日

【资源推荐】AI可解释性资源汇总

【资源推荐】AI可解释性资源汇总

专知

47+阅读 · 2019年4月24日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

2018 年 Top 10 影响力 AI 研究论文

2018 年 Top 10 影响力 AI 研究论文

AI科技评论

41+阅读 · 2019年1月6日

机器翻译学术论文写作方法和技巧

机器翻译学术论文写作方法和技巧

清华大学研究生教育

11+阅读 · 2018年12月23日

干货警告！国外有个小姐姐给29篇经典机器学习论文写了总结 | 资源

干货警告！国外有个小姐姐给29篇经典机器学习论文写了总结 | 资源

量子位

15+阅读 · 2018年12月11日

年度必读：2018最具突破性人工智能论文Top 10

年度必读：2018最具突破性人工智能论文Top 10

机器学习算法与Python学习

11+阅读 · 2018年12月2日

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

AI科技评论

12+阅读 · 2018年9月7日

责任式创新的共性理论基础与作用机理研究

国家自然科学基金

0+阅读 · 2017年12月31日

支持产品创新设计的大数据知识萃取研究

国家自然科学基金

8+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

内部社会资本与心理所有权对研发团队成员创造力的跨层次影响机理与实证研究

国家自然科学基金

0+阅读 · 2015年12月31日

技术多元化对企业持续创新的影响及其作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

创业型大学学术创业的实现机制及激励政策研究

国家自然科学基金

0+阅读 · 2014年12月31日

产学研合作创新网络演化机理、模型及政策研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

创新驱动、新老产品交替与工业增长方式转变研究

国家自然科学基金

0+阅读 · 2014年12月31日

社交学习网络环境下的创新能力理论与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

The embrace of open science: An analysis of a decade of AI research and 56 800 conference papers

Arxiv

0+阅读 · 6月15日

Critically Engaged Pragmatism: Scientific Norm and Social, Pragmatist Epistemology for AI Science Evaluation Tools

Arxiv

0+阅读 · 6月12日

Examining the Cognitive Gap Between Authors and Peer Reviewers on Academic Paper Novelty

Arxiv

0+阅读 · 6月11日

Quantifying Uncertainty in AI Visibility: A Statistical Framework for Generative Search Measurement

Arxiv

0+阅读 · 6月9日

sciwrite-lint: Verification Infrastructure for the Age of Science Vibe-Writing

Arxiv

0+阅读 · 5月24日

Material for Thought: Generative AI as an Active Creative Medium

Arxiv

0+阅读 · 5月19日

Usable but Conventional: An Empirical Study on the UX of AI-Generated Interface Prototypes

Arxiv

0+阅读 · 5月14日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月12日

Rethinking Publication: A Certification Framework for AI-Enabled Research

Arxiv

0+阅读 · 5月11日

An Axiomatic Benchmark for Evaluation of Scientific Novelty Metrics

Arxiv

0+阅读 · 4月16日

VIP会员

文章信息

相关主题

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

0+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

2+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

5+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

8+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

相关VIP内容

Nature杂志《AI科学家诞生：从构思到论文发表，全程无需人类插手》

Nature杂志《AI科学家诞生：从构思到论文发表，全程无需人类插手》

专知会员服务

27+阅读 · 3月28日

从Idea构想到论文发表：AI for Research全链路综述与实践

从Idea构想到论文发表：AI for Research全链路综述与实践

专知会员服务

25+阅读 · 2025年7月21日

AI4Research：科学研究中的人工智能综述

AI4Research：科学研究中的人工智能综述

专知会员服务

38+阅读 · 2025年7月4日

《AI生成视频评估综述》

《AI生成视频评估综述》

专知会员服务

28+阅读 · 2024年10月30日

【ICML2024】量化稳定扩散中的原创性

【ICML2024】量化稳定扩散中的原创性

专知会员服务

17+阅读 · 2024年8月18日

《负责任人工智能：概念、批判观点和信息系统研究议程》2022.12最新论文，挪威科技大学等

《负责任人工智能：概念、批判观点和信息系统研究议程》2022.12最新论文，挪威科技大学等

专知会员服务

26+阅读 · 2023年1月18日

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

专知会员服务

52+阅读 · 2022年8月24日

可信AI是什么？密歇根最新WWW2022《可信人工智能：一种计算视角》教程，附123页ppt

可信AI是什么？密歇根最新WWW2022《可信人工智能：一种计算视角》教程，附123页ppt

专知会员服务

90+阅读 · 2022年4月29日

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

你的论文可复现么？这个视频报告《机器学习中的复现性:从理论到实践》带你做复现研究，84页ppt

专知会员服务

48+阅读 · 2020年8月8日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

41+阅读 · 2020年1月13日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

AAAI,ICML,CVPR,NeurIPS...31篇国际七大AI顶会2021年度Best Papers 一文回顾

AAAI,ICML,CVPR,NeurIPS...31篇国际七大AI顶会2021年度Best Papers 一文回顾

机器之心

14+阅读 · 2022年2月5日

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知

24+阅读 · 2019年12月1日

AI可解释性文献列表

AI可解释性文献列表

专知

43+阅读 · 2019年10月7日

【资源推荐】AI可解释性资源汇总

【资源推荐】AI可解释性资源汇总

专知

47+阅读 · 2019年4月24日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

2018 年 Top 10 影响力 AI 研究论文

2018 年 Top 10 影响力 AI 研究论文

AI科技评论

41+阅读 · 2019年1月6日

机器翻译学术论文写作方法和技巧

机器翻译学术论文写作方法和技巧

清华大学研究生教育

11+阅读 · 2018年12月23日

干货警告！国外有个小姐姐给29篇经典机器学习论文写了总结 | 资源

干货警告！国外有个小姐姐给29篇经典机器学习论文写了总结 | 资源

量子位

15+阅读 · 2018年12月11日

年度必读：2018最具突破性人工智能论文Top 10

年度必读：2018最具突破性人工智能论文Top 10

机器学习算法与Python学习

11+阅读 · 2018年12月2日

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

AI科技评论

12+阅读 · 2018年9月7日

相关论文

The embrace of open science: An analysis of a decade of AI research and 56 800 conference papers

Arxiv

0+阅读 · 6月15日

Critically Engaged Pragmatism: Scientific Norm and Social, Pragmatist Epistemology for AI Science Evaluation Tools

Arxiv

0+阅读 · 6月12日

Examining the Cognitive Gap Between Authors and Peer Reviewers on Academic Paper Novelty

Arxiv

0+阅读 · 6月11日

Quantifying Uncertainty in AI Visibility: A Statistical Framework for Generative Search Measurement

Arxiv

0+阅读 · 6月9日

sciwrite-lint: Verification Infrastructure for the Age of Science Vibe-Writing

Arxiv

0+阅读 · 5月24日

Material for Thought: Generative AI as an Active Creative Medium

Arxiv

0+阅读 · 5月19日

Usable but Conventional: An Empirical Study on the UX of AI-Generated Interface Prototypes

Arxiv

0+阅读 · 5月14日

Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research

Arxiv

0+阅读 · 5月12日

Rethinking Publication: A Certification Framework for AI-Enabled Research

Arxiv

0+阅读 · 5月11日

An Axiomatic Benchmark for Evaluation of Scientific Novelty Metrics

Arxiv

0+阅读 · 4月16日

相关基金

责任式创新的共性理论基础与作用机理研究

国家自然科学基金

0+阅读 · 2017年12月31日

支持产品创新设计的大数据知识萃取研究

国家自然科学基金

8+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

内部社会资本与心理所有权对研发团队成员创造力的跨层次影响机理与实证研究

国家自然科学基金

0+阅读 · 2015年12月31日

技术多元化对企业持续创新的影响及其作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

创业型大学学术创业的实现机制及激励政策研究

国家自然科学基金

0+阅读 · 2014年12月31日

产学研合作创新网络演化机理、模型及政策研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

创新驱动、新老产品交替与工业增长方式转变研究

国家自然科学基金

0+阅读 · 2014年12月31日

社交学习网络环境下的创新能力理论与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员