A Study of Scientific Computational Notebook Quality - 专知论文

会员服务 ·

0

A Study of Scientific Computational Notebook Quality

翻译：科学计算笔记本质量研究

Shun Kashiwa,Ayla Kurdak,Savitha Ravi,Ridhi Srikanth,Angel Thakur,Sonia Chandra,Jonathan Truong,Michael Coblenz

The quality of scientific code is a critical concern for the research community. Poorly written code can result in irreproducible results, incorrect findings, and slower scientific progress. In this study, we evaluate scientific code quality across three dimensions: reproducibility, readability, and reusability. We curated a corpus of 518 code repositories by analyzing Code Availability statements from all 1239 Nature publications in 2024. To assess code quality, we employed multiple methods, including manual attempts to reproduce Jupyter notebooks, documentation reviews, and analyses of code clones and mutation patterns. Our results reveal major challenges in scientific code quality. Of the 19 notebooks we attempted to execute, only two were reproducible, primarily due to missing data files and dependency issues. Code duplication was also common, with 326 clone classes of at least 10 lines and three instances found among 637 of the 1510 notebooks in our corpus. These duplications frequently involved tasks such as visualization, data processing, and statistical analysis. Moreover, our mutation analysis showed that scientific notebooks often exhibit tangled state changes, complicating comprehension and reasoning. The prevalence of these issues -- unreproducible code, widespread duplication, and tangled state management -- underscores the need for improved tools and abstractions to help science build reproducible, readable and reusable software.

翻译：科学代码质量是研究界关注的核心问题。编写低劣的代码可能导致结果不可复现、结论错误以及科学进展缓慢。本研究从可复现性、可读性和可重用性三个维度评估科学代码质量。通过分析2024年《自然》期刊所有1239篇出版物中的代码可用性声明，我们构建了包含518个代码仓库的语料库。为评估代码质量，我们采用多种方法：手动尝试复现Jupyter笔记本、文档审查，以及代码克隆与变异模式分析。研究结果揭示了科学代码质量面临的重大挑战：在尝试执行的19个笔记本中，仅有两个具备可复现性，主要原因在于数据文件缺失和依赖性问题。代码重复现象同样普遍，在1510个笔记本构成的研究语料库中，637个笔记本存在至少包含10行代码及3个实例的326个克隆类群。这些重复代码频繁涉及可视化、数据处理和统计分析等任务。此外，变异分析表明，科学笔记本常呈现状态变更混乱的特征，增加了理解与推理的难度。此类问题的普遍存在——不可复现代码、广泛重复与状态管理混乱——凸显出亟需改进工具与抽象方法，以助力科学界构建可复现、可读且可重用的软件。

0

相关内容

【博士论文】因果机器学习中的数据质量研究：算法公平性的应用

【博士论文】因果机器学习中的数据质量研究：算法公平性的应用

专知会员服务

18+阅读 · 2025年11月10日

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

【2022新书】金融服务中的数据质量工程:将制造技术应用于数据，245页pdf

【2022新书】金融服务中的数据质量工程:将制造技术应用于数据，245页pdf

专知会员服务

49+阅读 · 2022年10月30日

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

专知会员服务

52+阅读 · 2022年8月24日

如何做好科研？德国图宾根大学Andreas这份《科研阅读、写作与报告》82页PPT，手把手教你实操科研: 读写评讲论文

如何做好科研？德国图宾根大学Andreas这份《科研阅读、写作与报告》82页PPT，手把手教你实操科研: 读写评讲论文

专知会员服务

220+阅读 · 2022年4月13日

编码计算研究综述

编码计算研究综述

专知会员服务

22+阅读 · 2021年10月26日

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

专知会员服务

25+阅读 · 2021年10月3日

【MIT经典书】计算机科学数学，918页pdf

专知会员服务

129+阅读 · 2021年6月23日

【干货书】计算机科学，647页pdf，Computer Science

【干货书】计算机科学，647页pdf，Computer Science

专知会员服务

46+阅读 · 2021年5月10日

微软研究院新版书籍《数据科学基础》（Foundations of Data Science），附479页PDF下载

微软研究院新版书籍《数据科学基础》（Foundations of Data Science），附479页PDF下载

专知会员服务

137+阅读 · 2019年10月26日

【干货书】数据科学手册，456页pdf

【干货书】数据科学手册，456页pdf

专知

15+阅读 · 2021年4月28日

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

专知

15+阅读 · 2020年3月25日

微软研究院新版书籍《数据科学基础》，附479页PDF下载

微软研究院新版书籍《数据科学基础》，附479页PDF下载

专知

47+阅读 · 2019年9月20日

1200+标星，3千多人点赞，这本书让你系统了解机器学习可解释性丨开源免费阅读

1200+标星，3千多人点赞，这本书让你系统了解机器学习可解释性丨开源免费阅读

量子位

13+阅读 · 2019年7月16日

微软研究院出品《数据科学基础》，放眼未来40年（附PDF下载）

微软研究院出品《数据科学基础》，放眼未来40年（附PDF下载）

THU数据派

40+阅读 · 2019年5月21日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

【EMNLP2018干货】254 页《为NLP研究写出好代码》教程

【EMNLP2018干货】254 页《为NLP研究写出好代码》教程

专知

10+阅读 · 2018年11月2日

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

PaperWeekly

12+阅读 · 2017年12月14日

送你6份最新开源代码！含NLP、ML、计算机视觉方向（附代码&论文）

送你6份最新开源代码！含NLP、ML、计算机视觉方向（附代码&论文）

数据派THU

13+阅读 · 2017年11月29日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

系统科学与复杂性学报（英文版）

国家自然科学基金

12+阅读 · 2015年12月31日

量子码的构造

国家自然科学基金

1+阅读 · 2015年12月31日

医疗健康网站信息可信度与质量控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

代数整数的性质研究和无理测度的计算

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

SHVC质量可伸缩视频编码的快速算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Liberata -- Graph Scientometrics for a Share Based System of Academic Publishing

Arxiv

0+阅读 · 5月4日

The software space of science

Arxiv

0+阅读 · 4月26日

Institutionalizing Best Practices in Research Computing: A Framework and Case Study for Improving User Onboarding

Arxiv

0+阅读 · 4月23日

PAPERMIND: Benchmarking Agentic Reasoning and Critique over Scientific Papers in Multimodal LLMs

Arxiv

0+阅读 · 4月23日

Fast and Forgettable: A Controlled Study of Novices' Performance, Learning, Workload, and Emotion in AI-Assisted and Human Pair Programming Paradigms

Arxiv

0+阅读 · 4月20日

sciwrite-lint: Verification Infrastructure for the Age of Science Vibe-Writing

Arxiv

0+阅读 · 4月9日

Containing the Reproducibility Gap: Automated Repository-Level Containerization for Scholarly Jupyter Notebooks

Arxiv

0+阅读 · 4月1日

SciCoQA: Quality Assurance for Scientific Paper--Code Alignment

Arxiv

0+阅读 · 3月26日

Dynamic analysis enhances issue resolution

Arxiv

0+阅读 · 3月24日

Journal Research Data Policies in Materials Science

Arxiv

0+阅读 · 3月11日

VIP会员

文章信息

相关主题

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

3+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

1+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

1+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

1+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

6+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

5+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

8+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

9+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

9+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

【博士论文】因果机器学习中的数据质量研究：算法公平性的应用

【博士论文】因果机器学习中的数据质量研究：算法公平性的应用

专知会员服务

18+阅读 · 2025年11月10日

数据质量维度的实践展开：一项综述

数据质量维度的实践展开：一项综述

专知会员服务

20+阅读 · 2025年7月28日

【2022新书】金融服务中的数据质量工程:将制造技术应用于数据，245页pdf

【2022新书】金融服务中的数据质量工程:将制造技术应用于数据，245页pdf

专知会员服务

49+阅读 · 2022年10月30日

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

专知会员服务

52+阅读 · 2022年8月24日

如何做好科研？德国图宾根大学Andreas这份《科研阅读、写作与报告》82页PPT，手把手教你实操科研: 读写评讲论文

如何做好科研？德国图宾根大学Andreas这份《科研阅读、写作与报告》82页PPT，手把手教你实操科研: 读写评讲论文

专知会员服务

220+阅读 · 2022年4月13日

编码计算研究综述

编码计算研究综述

专知会员服务

22+阅读 · 2021年10月26日

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

中科院计算所发布首篇「面向第一阶段检索的语义检索模型」综述论文，43页pdf242篇文献

专知会员服务

25+阅读 · 2021年10月3日

【MIT经典书】计算机科学数学，918页pdf

专知会员服务

129+阅读 · 2021年6月23日

【干货书】计算机科学，647页pdf，Computer Science

【干货书】计算机科学，647页pdf，Computer Science

专知会员服务

46+阅读 · 2021年5月10日

微软研究院新版书籍《数据科学基础》（Foundations of Data Science），附479页PDF下载

微软研究院新版书籍《数据科学基础》（Foundations of Data Science），附479页PDF下载

专知会员服务

137+阅读 · 2019年10月26日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

【干货书】数据科学手册，456页pdf

【干货书】数据科学手册，456页pdf

专知

15+阅读 · 2021年4月28日

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

【2020新书】MySQL 8查询性能调优，974页pdf，一种提高执行速度的系统方法

专知

15+阅读 · 2020年3月25日

微软研究院新版书籍《数据科学基础》，附479页PDF下载

微软研究院新版书籍《数据科学基础》，附479页PDF下载

专知

47+阅读 · 2019年9月20日

1200+标星，3千多人点赞，这本书让你系统了解机器学习可解释性丨开源免费阅读

1200+标星，3千多人点赞，这本书让你系统了解机器学习可解释性丨开源免费阅读

量子位

13+阅读 · 2019年7月16日

微软研究院出品《数据科学基础》，放眼未来40年（附PDF下载）

微软研究院出品《数据科学基础》，放眼未来40年（附PDF下载）

THU数据派

40+阅读 · 2019年5月21日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

【EMNLP2018干货】254 页《为NLP研究写出好代码》教程

【EMNLP2018干货】254 页《为NLP研究写出好代码》教程

专知

10+阅读 · 2018年11月2日

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

PaperWeekly

12+阅读 · 2017年12月14日

送你6份最新开源代码！含NLP、ML、计算机视觉方向（附代码&论文）

送你6份最新开源代码！含NLP、ML、计算机视觉方向（附代码&论文）

数据派THU

13+阅读 · 2017年11月29日

相关论文

Liberata -- Graph Scientometrics for a Share Based System of Academic Publishing

Arxiv

0+阅读 · 5月4日

The software space of science

Arxiv

0+阅读 · 4月26日

Institutionalizing Best Practices in Research Computing: A Framework and Case Study for Improving User Onboarding

Arxiv

0+阅读 · 4月23日

PAPERMIND: Benchmarking Agentic Reasoning and Critique over Scientific Papers in Multimodal LLMs

Arxiv

0+阅读 · 4月23日

Fast and Forgettable: A Controlled Study of Novices' Performance, Learning, Workload, and Emotion in AI-Assisted and Human Pair Programming Paradigms

Arxiv

0+阅读 · 4月20日

sciwrite-lint: Verification Infrastructure for the Age of Science Vibe-Writing

Arxiv

0+阅读 · 4月9日

Containing the Reproducibility Gap: Automated Repository-Level Containerization for Scholarly Jupyter Notebooks

Arxiv

0+阅读 · 4月1日

SciCoQA: Quality Assurance for Scientific Paper--Code Alignment

Arxiv

0+阅读 · 3月26日

Dynamic analysis enhances issue resolution

Arxiv

0+阅读 · 3月24日

Journal Research Data Policies in Materials Science

Arxiv

0+阅读 · 3月11日

相关基金

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

系统科学与复杂性学报（英文版）

国家自然科学基金

12+阅读 · 2015年12月31日

量子码的构造

国家自然科学基金

1+阅读 · 2015年12月31日

医疗健康网站信息可信度与质量控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

代数整数的性质研究和无理测度的计算

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

SHVC质量可伸缩视频编码的快速算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员