Context: Code coverage is widely used as a software quality assurance measure. However, its effect, and specifically the advisable dose, are disputed in both the research and engineering communities. Prior work reports only correlational associations, leaving results vulnerable to confounding factors. Objective: We aim to quantify the causal effect of code coverage (exposure) on bug introduction (outcome) in the context of mature JavaScript and TypeScript open source projects, addressing both the overall effect and its variance across coverage levels. Method: We construct a causal directed acyclic graph to identify confounders within the software engineering process, modeling key variables from the source code, issue- and review systems, and continuous integration. Using generalized propensity score adjustment, we will apply doubly robust regression-based causal inference for continuous exposure to a novel dataset of bug-introducing and non-bug-introducing changes. We estimate the average treatment effect and dose-response relationship to examine potential non-linear patterns (e.g., thresholds or diminishing returns) within the projects of our dataset.


翻译:背景:代码覆盖率被广泛用作软件质量保证的度量指标。然而,其效果,特别是建议的覆盖程度,在研究和工程界均存在争议。先前工作仅报告了相关性关联,使得结果易受混杂因素影响。目标:本研究旨在成熟JavaScript与TypeScript开源项目的背景下,量化代码覆盖率(暴露)对缺陷引入(结果)的因果效应,同时探究整体效应及其在不同覆盖率水平间的变异。方法:我们构建因果有向无环图以识别软件工程过程中的混杂因素,对源代码、问题与评审系统以及持续集成中的关键变量进行建模。利用广义倾向得分调整,我们将基于双重稳健回归的因果推断方法应用于连续暴露的新型数据集,该数据集包含缺陷引入与非缺陷引入的代码变更。通过估计平均处理效应与剂量-反应关系,我们探究数据集中项目内潜在的非线性模式(例如阈值效应或收益递减现象)。

0
下载
关闭预览

相关内容

代码(Code)是专知网的一个重要知识资料文档板块,旨在整理收录论文源代码、复现代码,经典工程代码等,便于用户查阅下载使用。
AI生成代码缺陷综述
专知会员服务
16+阅读 · 2025年12月8日
编码计算研究综述
专知会员服务
22+阅读 · 2021年10月26日
因果推断,Causal Inference:The Mixtape
专知会员服务
110+阅读 · 2021年8月27日
专知会员服务
17+阅读 · 2021年5月13日
专知会员服务
10+阅读 · 2021年1月31日
专知会员服务
16+阅读 · 2021年1月23日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
浅析Faiss在推荐系统中的应用及原理
凡人机器学习
11+阅读 · 2020年5月5日
机器学习的可解释性:因果推理和稳定学习
DataFunTalk
13+阅读 · 2020年3月3日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
因果推理学习算法资源大列表
专知
27+阅读 · 2019年3月3日
相关性≠因果:概率图模型和do-calculus
论智
31+阅读 · 2018年10月29日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
AI生成代码缺陷综述
专知会员服务
16+阅读 · 2025年12月8日
编码计算研究综述
专知会员服务
22+阅读 · 2021年10月26日
因果推断,Causal Inference:The Mixtape
专知会员服务
110+阅读 · 2021年8月27日
专知会员服务
17+阅读 · 2021年5月13日
专知会员服务
10+阅读 · 2021年1月31日
专知会员服务
16+阅读 · 2021年1月23日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员