Repository-level bug localization-the task of identifying where code must be modified to fix a bug-is a critical software engineering challenge. Standard Large Language Modles (LLMs) are often unsuitable for this task due to context window limitations that prevent them from processing entire code repositories. As a result, various retrieval methods are commonly used, including keyword matching, text similarity, and simple graph-based heuristics such as Breadth-First Search. Graph Neural Networks (GNNs) offer a promising alternative due to their ability to model complex, repository-wide dependencies; however, their application has been hindered by the lack of a dedicated benchmark. To address this gap, we introduce GREPO, the first GNN benchmark for repository-scale bug localization tasks. GREPO comprises 86 Python repositories and 47294 bug-fixing tasks, providing graph-based data structures ready for direct GNN processing. Our evaluation of various GNN architectures shows outstanding performance compared to established information retrieval baselines. This work highlights the potential of GNNs for bug localization and established GREPO as a foundation resource for future research, The code is available at https://github.com/qingpingmo/GREPO.


翻译:仓库级缺陷定位——即识别需要修改哪些代码以修复缺陷的任务——是一项关键的软件工程挑战。标准的大型语言模型(LLMs)由于上下文窗口限制而无法处理整个代码仓库,通常不适用于此任务。因此,通常采用各种检索方法,包括关键词匹配、文本相似度以及简单的基于图的启发式方法(如广度优先搜索)。图神经网络(GNNs)因其能够建模复杂的、仓库范围内的依赖关系而成为一种有前景的替代方案;然而,由于缺乏专用基准,其应用一直受到阻碍。为填补这一空白,我们提出了GREPO,这是首个面向仓库级缺陷定位任务的GNN基准。GREPO包含86个Python仓库和47294个缺陷修复任务,提供了可直接用于GNN处理的基于图的数据结构。我们对多种GNN架构的评估表明,相较于现有的信息检索基线方法,其性能表现优异。这项工作凸显了GNN在缺陷定位任务中的潜力,并将GREPO确立为未来研究的基础资源。代码可在https://github.com/qingpingmo/GREPO获取。

0
下载
关闭预览

相关内容

大型语言模型系统中提示缺陷的分类学
专知会员服务
8+阅读 · 2025年9月19日
PlanGenLLMs:大型语言模型规划能力的最新综述
专知会员服务
33+阅读 · 2025年5月18日
大型语言模型对齐技术综述:RLHF、RLAIF、PPO、DPO 等
专知会员服务
55+阅读 · 2024年7月24日
KnowledGPT:基于知识库的检索和存储访问增强大型语言模型
专知会员服务
10+阅读 · 2021年1月31日
深度学习的目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNN
数据挖掘入门与实战
13+阅读 · 2018年4月6日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员