同行评审质量真的在下降吗？跨会议与跨时间的评审质量分析 (Is Peer Review Really in Decline? Analyzing Review Quality across Venues and Time) - 专知论文

会员服务 ·

0

会议 · 同行评审 · 分析 · 演进 · ICLR ·

Is Peer Review Really in Decline? Analyzing Review Quality across Venues and Time

翻译：同行评审质量真的在下降吗？跨会议与跨时间的评审质量分析

Ilia Kuznetsov,Rohan Nayak,Alla Rozovskaya,Iryna Gurevych

Peer review is at the heart of modern science. As submission numbers rise and research communities grow, the decline in review quality is a popular narrative and a common concern. Yet, is it true? Review quality is difficult to measure, and the ongoing evolution of reviewing practices makes it hard to compare reviews across venues and time. To address this, we introduce a new framework for evidence-based comparative study of review quality and apply it to major AI and machine learning conferences: ICLR, NeurIPS and *ACL. We document the diversity of review formats and introduce a new approach to review standardization. We propose a multi-dimensional schema for quantifying review quality as utility to editors and authors, coupled with both LLM-based and lightweight measurements. We study the relationships between measurements of review quality, and its evolution over time. Contradicting the popular narrative, our cross-temporal analysis reveals no consistent decline in median review quality across venues and years. We propose alternative explanations, and outline recommendations to facilitate future empirical studies of review quality.

翻译：同行评审是现代科学的核心环节。随着投稿数量的增加和研究社区的扩大，评审质量下降已成为一种流行叙事和普遍关切。然而，这一说法是否属实？评审质量难以量化，且评审实践的持续演进使得跨会议、跨时间的比较变得困难。为此，我们提出了一个基于证据的评审质量比较研究新框架，并将其应用于主要人工智能与机器学习会议：ICLR、NeurIPS和*ACL。我们记录了评审形式的多样性，并提出了一种评审标准化的新方法。我们设计了一个多维量化框架，将评审质量定义为对编辑和作者的效用价值，并辅以基于大语言模型和轻量级的测量方法。我们研究了评审质量各项测量指标之间的关系及其随时间的变化趋势。与流行叙事相反，我们的跨时间分析表明，在不同会议和年份中，评审质量中位数并未出现系统性下降。我们提出了替代性解释，并概述了促进未来评审质量实证研究的建议。

0

相关内容

学术会议，包括国内外相关会议

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

事件抽取的再评价:过去、现在和未来的挑战

事件抽取的再评价:过去、现在和未来的挑战

专知会员服务

25+阅读 · 2023年11月28日

视频质量评价研究综述

视频质量评价研究综述

专知会员服务

27+阅读 · 2023年10月10日

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

专知会员服务

52+阅读 · 2022年8月24日

【CVPR 2022】基于粗粒度和细粒度特征匹配的视频描述评估，EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained Embedding Matching

【CVPR 2022】基于粗粒度和细粒度特征匹配的视频描述评估，EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained Embedding Matching

专知会员服务

10+阅读 · 2022年3月19日

图像与视频质量评价综述

专知会员服务

34+阅读 · 2021年9月29日

最新《从观察数据发现因果性》，150页ppt

专知会员服务

66+阅读 · 2021年1月6日

异质信息网络分析与应用综述，软件学报-北京邮电大学

异质信息网络分析与应用综述，软件学报-北京邮电大学

专知会员服务

64+阅读 · 2020年7月9日

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

专知会员服务

36+阅读 · 2020年3月19日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

专知

12+阅读 · 2022年11月25日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

综述 | 异质信息网络分析与应用综述

综述 | 异质信息网络分析与应用综述

专知

27+阅读 · 2020年8月8日

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

专知

12+阅读 · 2020年5月14日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

ICLR 2020，你的论文提供代码了吗？这届评审不好惹

ICLR 2020，你的论文提供代码了吗？这届评审不好惹

专知

39+阅读 · 2019年10月15日

无参考图像质量评价研究进展综述

无参考图像质量评价研究进展综述

人工智能前沿讲习班

47+阅读 · 2019年2月15日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

PaperWeekly

12+阅读 · 2017年12月14日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

社会信任程度对于审计师行为的影响及经济后果研究——基于事务所和签字审计师层面

国家自然科学基金

0+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于“投入-产出”的专业学位质量评估模型的构建与实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

协同创新项目利益多层次多阶段动态均衡及促进政策研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

FMMD: A multimodal open peer review dataset based on F1000Research

Arxiv

0+阅读 · 2月15日

OmniReview: A Large-scale Benchmark and LLM-enhanced Framework for Realistic Reviewer Recommendation

Arxiv

0+阅读 · 2月9日

Paper Copilot: Tracking the Evolution of Peer Review in AI Conferences

Arxiv

0+阅读 · 2月9日

ScholarPeer: A Context-Aware Multi-Agent Framework for Automated Peer Review

Arxiv

0+阅读 · 1月30日

Reimagining Peer Review Process Through Multi-Agent Mechanism Design

Arxiv

0+阅读 · 1月27日

UnWEIRDing Peer Review in Human Computer Interaction

Arxiv

0+阅读 · 1月24日

Preventing the Collapse of Peer Review Requires Verification-First AI

Arxiv

0+阅读 · 1月23日

Decision-Making with Deliberation: Meta-reviewing as a Document-grounded Dialogue

Arxiv

0+阅读 · 1月21日

Beyond "Not Novel Enough": Enriching Scholarly Critique with LLM-Assisted Feedback

Arxiv

0+阅读 · 1月20日

Position on LLM-Assisted Peer Review: Addressing Reviewer Gap through Mentoring and Feedback

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

相关VIP内容

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

事件抽取的再评价:过去、现在和未来的挑战

事件抽取的再评价:过去、现在和未来的挑战

专知会员服务

25+阅读 · 2023年11月28日

视频质量评价研究综述

视频质量评价研究综述

专知会员服务

27+阅读 · 2023年10月10日

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

专知会员服务

52+阅读 · 2022年8月24日

【CVPR 2022】基于粗粒度和细粒度特征匹配的视频描述评估，EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained Embedding Matching

【CVPR 2022】基于粗粒度和细粒度特征匹配的视频描述评估，EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained Embedding Matching

专知会员服务

10+阅读 · 2022年3月19日

图像与视频质量评价综述

专知会员服务

34+阅读 · 2021年9月29日

最新《从观察数据发现因果性》，150页ppt

专知会员服务

66+阅读 · 2021年1月6日

异质信息网络分析与应用综述，软件学报-北京邮电大学

异质信息网络分析与应用综述，软件学报-北京邮电大学

专知会员服务

64+阅读 · 2020年7月9日

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

【论文推荐】保护隐私的协同过滤综述，Survey of Privacy-Preserving Collaborative Filtering

专知会员服务

36+阅读 · 2020年3月19日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

专知

12+阅读 · 2022年11月25日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

综述 | 异质信息网络分析与应用综述

综述 | 异质信息网络分析与应用综述

专知

27+阅读 · 2020年8月8日

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

对话管理的综述论文:最近的进展和挑战，A Survey on Dialog Management

专知

12+阅读 · 2020年5月14日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

ICLR 2020，你的论文提供代码了吗？这届评审不好惹

ICLR 2020，你的论文提供代码了吗？这届评审不好惹

专知

39+阅读 · 2019年10月15日

无参考图像质量评价研究进展综述

无参考图像质量评价研究进展综述

人工智能前沿讲习班

47+阅读 · 2019年2月15日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

PaperWeekly

12+阅读 · 2017年12月14日

相关论文

FMMD: A multimodal open peer review dataset based on F1000Research

Arxiv

0+阅读 · 2月15日

OmniReview: A Large-scale Benchmark and LLM-enhanced Framework for Realistic Reviewer Recommendation

Arxiv

0+阅读 · 2月9日

Paper Copilot: Tracking the Evolution of Peer Review in AI Conferences

Arxiv

0+阅读 · 2月9日

ScholarPeer: A Context-Aware Multi-Agent Framework for Automated Peer Review

Arxiv

0+阅读 · 1月30日

Reimagining Peer Review Process Through Multi-Agent Mechanism Design

Arxiv

0+阅读 · 1月27日

UnWEIRDing Peer Review in Human Computer Interaction

Arxiv

0+阅读 · 1月24日

Preventing the Collapse of Peer Review Requires Verification-First AI

Arxiv

0+阅读 · 1月23日

Decision-Making with Deliberation: Meta-reviewing as a Document-grounded Dialogue

Arxiv

0+阅读 · 1月21日

Beyond "Not Novel Enough": Enriching Scholarly Critique with LLM-Assisted Feedback

Arxiv

0+阅读 · 1月20日

Position on LLM-Assisted Peer Review: Addressing Reviewer Gap through Mentoring and Feedback

Arxiv

0+阅读 · 1月14日

相关基金

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

社会信任程度对于审计师行为的影响及经济后果研究——基于事务所和签字审计师层面

国家自然科学基金

0+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

网状meta分析实效性评价方法及其广义线性混合效应模型的构建与应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于“投入-产出”的专业学位质量评估模型的构建与实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

协同创新项目利益多层次多阶段动态均衡及促进政策研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员