Dynamic Cogeneration of Bug Reproduction Test in Agentic Program Repair - 专知论文

会员服务 ·

0

协同 · 系统 · 动态协同 · 包含 · 分析 ·

Dynamic Cogeneration of Bug Reproduction Test in Agentic Program Repair

翻译：动态协同生成代理程序修复中的缺陷复现测试

Runxiang Cheng,Michele Tufano,José Cambronero,Renyao Wei,Sherry Shi,Grant Uy,Pat Rondon,Franjo Ivančić

Bug Reproduction Tests (BRTs) have been used in many agentic Automated Program Repair (APR) systems, primarily for validating promising fixes and aiding fix generation. In practice, when developers submit a patch, they often implement the BRT alongside the fix. Our experience deploying agentic APR reveals that developers similarly desire a BRT within AI-generated patches to increase their confidence. However, canonical APR systems tend to generate BRTs and fixes separately, or focus on producing only the fix in the final patch. In this paper, we study agentic APR in the context of cogeneration, where the APR agent is instructed to generate both a fix and a BRT in the same patch. We evaluate the effectiveness of different cogeneration strategies on 120 human-reported bugs at Google and characterize different cogeneration strategies by their influence on APR agent behavior. We develop and evaluate patch selectors that account for test change information to select patches with plausible fixes (and plausible BRTs). Finally, we analyze the root causes of failed cogeneration trajectories. Importantly, we show that cogeneration allows the APR agent to generate BRTs for at least as many bugs as a dedicated BRT agent, without compromising the generation rate of plausible fixes, thereby reducing engineering effort in maintaining and coordinating separate generation pipelines for fix and BRT at scale.

翻译：缺陷复现测试（BRT）已被广泛应用于多种代理式自动程序修复（APR）系统中，主要用于验证潜在修复方案并辅助修复生成。实践中，开发者在提交补丁时通常会同步实现相应的BRT。我们在部署代理式APR系统的经验中发现，开发者同样期望在AI生成的补丁中包含BRT以增强其信心。然而，典型的APR系统往往将BRT与修复方案分离生成，或在最终补丁中仅专注于生成修复方案。本文研究协同生成背景下的代理式APR，即指导APR代理在同一补丁中同时生成修复方案与BRT。我们基于谷歌120个人工上报的缺陷评估不同协同生成策略的有效性，并通过分析其对APR代理行为的影响来刻画各类策略特征。我们开发并评估了能够利用测试变更信息的补丁选择器，以筛选出包含合理修复方案（及合理BRT）的补丁。最后，我们深入分析了协同生成轨迹失败的根源。关键发现表明：协同生成机制能使APR代理为至少与专用BRT代理等量的缺陷生成BRT，同时保持合理修复方案的生成率不受影响，从而显著降低了大规模维护与协调修复方案和BRT独立生成管线的工程成本。

0

相关内容

AI生成代码缺陷综述

AI生成代码缺陷综述

专知会员服务

17+阅读 · 2025年12月8日

【EMNLP2025】ReCode：基于细粒度检索增强生成的LLM代码修复方法

【EMNLP2025】ReCode：基于细粒度检索增强生成的LLM代码修复方法

专知会员服务

10+阅读 · 2025年9月3日

【ICLR2025】DynaPrompt：动态测试时提示调优

【ICLR2025】DynaPrompt：动态测试时提示调优

专知会员服务

10+阅读 · 2025年2月2日

【新书】使用生成式人工智能进行软件测试

【新书】使用生成式人工智能进行软件测试

专知会员服务

46+阅读 · 2025年1月6日

人工智能驱动的自动程序修复与代码生成的技术与进展全面综述

人工智能驱动的自动程序修复与代码生成的技术与进展全面综述

专知会员服务

26+阅读 · 2024年11月15日

大型语言模型自动程序修复的系统文献综述

大型语言模型自动程序修复的系统文献综述

专知会员服务

43+阅读 · 2024年5月5日

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

37+阅读 · 2023年7月22日

生成先验的信号恢复

生成先验的信号恢复

专知会员服务

22+阅读 · 2023年1月5日

软件缺陷自动修复技术综述

专知会员服务

14+阅读 · 2021年9月21日

【O'Reilly TensorFlow Conference 2019】恶意软件检测（Generative malware outbreak detection），Sean Park | Trend Micro

【O'Reilly TensorFlow Conference 2019】恶意软件检测（Generative malware outbreak detection），Sean Park | Trend Micro

专知会员服务

15+阅读 · 2019年11月13日

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

CSDN

11+阅读 · 2023年4月13日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

Xsser 一款自动检测XSS漏洞工具

Xsser 一款自动检测XSS漏洞工具

黑白之道

14+阅读 · 2019年8月26日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

产业智能官

15+阅读 · 2019年2月1日

时序异常检测算法概览

时序异常检测算法概览

论智

29+阅读 · 2018年8月30日

【机器视觉】表面缺陷检测：机器视觉检测技术

【机器视觉】表面缺陷检测：机器视觉检测技术

产业智能官

25+阅读 · 2018年5月30日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

基于机器学习的KPI自动化异常检测系统

基于机器学习的KPI自动化异常检测系统

运维帮

13+阅读 · 2017年8月16日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

面向动态演化的网构软件失效机理与测评方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

类簇级测试中类测试序的生成技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

数据驱动的被动协议测试方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态作业负荷的混联制造系统预知维护和机会维修方法

国家自然科学基金

2+阅读 · 2014年12月31日

A Systematic Literature Review on Large Language Models for Automated Program Repair

Arxiv

0+阅读 · 2月10日

Specification Vibing for Automated Program Repair

Arxiv

0+阅读 · 2月9日

ComPass: Contrastive Learning for Automated Patch Correctness Assessment in Program Repair

Arxiv

0+阅读 · 2月7日

A Dual-Loop Agent Framework for Automated Vulnerability Reproduction

Arxiv

0+阅读 · 2月5日

Understanding Bug-Reproducing Tests: A First Empirical Study

Arxiv

0+阅读 · 2月3日

Abstain and Validate: A Dual-LLM Policy for Reducing Noise in Agentic Program Repair

Arxiv

0+阅读 · 1月29日

Adversarial Bug Reports as a Security Risk in Language Model-Based Automated Program Repair

Arxiv

0+阅读 · 1月26日

Improved Bug Localization with AI Agents Leveraging Hypothesis and Dynamic Cognition

Arxiv

0+阅读 · 1月18日

Leveraging Mutation Analysis for LLM-based Repair of Quantum Programs

Arxiv

0+阅读 · 1月18日

SysPro: Reproducing System-level Concurrency Bugs from Bug Reports

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

0+阅读 · 今天15:55

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

0+阅读 · 今天15:53

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

11+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

相关VIP内容

AI生成代码缺陷综述

AI生成代码缺陷综述

专知会员服务

17+阅读 · 2025年12月8日

【EMNLP2025】ReCode：基于细粒度检索增强生成的LLM代码修复方法

【EMNLP2025】ReCode：基于细粒度检索增强生成的LLM代码修复方法

专知会员服务

10+阅读 · 2025年9月3日

【ICLR2025】DynaPrompt：动态测试时提示调优

【ICLR2025】DynaPrompt：动态测试时提示调优

专知会员服务

10+阅读 · 2025年2月2日

【新书】使用生成式人工智能进行软件测试

【新书】使用生成式人工智能进行软件测试

专知会员服务

46+阅读 · 2025年1月6日

人工智能驱动的自动程序修复与代码生成的技术与进展全面综述

人工智能驱动的自动程序修复与代码生成的技术与进展全面综述

专知会员服务

26+阅读 · 2024年11月15日

大型语言模型自动程序修复的系统文献综述

大型语言模型自动程序修复的系统文献综述

专知会员服务

43+阅读 · 2024年5月5日

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

37+阅读 · 2023年7月22日

生成先验的信号恢复

生成先验的信号恢复

专知会员服务

22+阅读 · 2023年1月5日

软件缺陷自动修复技术综述

专知会员服务

14+阅读 · 2021年9月21日

【O'Reilly TensorFlow Conference 2019】恶意软件检测（Generative malware outbreak detection），Sean Park | Trend Micro

【O'Reilly TensorFlow Conference 2019】恶意软件检测（Generative malware outbreak detection），Sean Park | Trend Micro

专知会员服务

15+阅读 · 2019年11月13日

热门VIP内容

开通专知VIP会员享更多权益服务

GNN跨域综述：从消息传递到图基础模型

巡飞弹与反无人机系统——现代战场的两大支柱

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

无人机自主控制与人工智能：系统性综述

相关资讯

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

CSDN

11+阅读 · 2023年4月13日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

Xsser 一款自动检测XSS漏洞工具

Xsser 一款自动检测XSS漏洞工具

黑白之道

14+阅读 · 2019年8月26日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

【机器视觉】人工智能检测设备实现手机外观缺陷全自动检测、基于人工智能的PCB表面瑕疵检测

产业智能官

15+阅读 · 2019年2月1日

时序异常检测算法概览

时序异常检测算法概览

论智

29+阅读 · 2018年8月30日

【机器视觉】表面缺陷检测：机器视觉检测技术

【机器视觉】表面缺陷检测：机器视觉检测技术

产业智能官

25+阅读 · 2018年5月30日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

基于机器学习的KPI自动化异常检测系统

基于机器学习的KPI自动化异常检测系统

运维帮

13+阅读 · 2017年8月16日

相关论文

A Systematic Literature Review on Large Language Models for Automated Program Repair

Arxiv

0+阅读 · 2月10日

Specification Vibing for Automated Program Repair

Arxiv

0+阅读 · 2月9日

ComPass: Contrastive Learning for Automated Patch Correctness Assessment in Program Repair

Arxiv

0+阅读 · 2月7日

A Dual-Loop Agent Framework for Automated Vulnerability Reproduction

Arxiv

0+阅读 · 2月5日

Understanding Bug-Reproducing Tests: A First Empirical Study

Arxiv

0+阅读 · 2月3日

Abstain and Validate: A Dual-LLM Policy for Reducing Noise in Agentic Program Repair

Arxiv

0+阅读 · 1月29日

Adversarial Bug Reports as a Security Risk in Language Model-Based Automated Program Repair

Arxiv

0+阅读 · 1月26日

Improved Bug Localization with AI Agents Leveraging Hypothesis and Dynamic Cognition

Arxiv

0+阅读 · 1月18日

Leveraging Mutation Analysis for LLM-based Repair of Quantum Programs

Arxiv

0+阅读 · 1月18日

SysPro: Reproducing System-level Concurrency Bugs from Bug Reports

Arxiv

0+阅读 · 1月14日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

面向动态演化的网构软件失效机理与测评方法

国家自然科学基金

1+阅读 · 2015年12月31日

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

类簇级测试中类测试序的生成技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

数据驱动的被动协议测试方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态作业负荷的混联制造系统预知维护和机会维修方法

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员