Imitation Game: Reproducing Deep Learning Bugs Leveraging an Intelligent Agent - 专知论文

会员服务 ·

0

深度学习 · 智能代理 · 金融 · 软件 · 学习模型 ·

Imitation Game: Reproducing Deep Learning Bugs Leveraging an Intelligent Agent

翻译：模仿游戏：利用智能代理复现深度学习缺陷

Mehil B Shah,Mohammad Masudur Rahman,Foutse Khomh

from arxiv, Accepted by the 48th IEEE/ACM International Conference on Software Engineering (ICSE 2026)

Despite their wide adoption in various domains (e.g., healthcare, finance, software engineering), Deep Learning (DL)-based applications suffer from many bugs, failures, and vulnerabilities. Reproducing these bugs is essential for their resolution, but it is extremely challenging due to the inherent nondeterminism of DL models and their tight coupling with hardware and software environments. According to recent studies, only about 3% of DL bugs can be reliably reproduced using manual approaches. To address these challenges, we present RepGen, a novel, automated, and intelligent approach for reproducing deep learning bugs. RepGen constructs a learning-enhanced context from a project, develops a comprehensive plan for bug reproduction, employs an iterative generate-validate-refine mechanism, and thus generates such code using an LLM that reproduces the bug at hand. We evaluate RepGen on 106 real-world deep learning bugs and achieve a reproduction rate of 80.19%, a 19.81% improvement over the state-of-the-art measure. A developer study involving 27 participants shows that RepGen improves the success rate of DL bug reproduction by 23.35%, reduces the time to reproduce by 56.8%, and lowers participants' cognitive load.

翻译：尽管深度学习（DL）应用已在多个领域（如医疗保健、金融、软件工程）得到广泛采用，但其仍存在大量缺陷、故障与漏洞。复现这些缺陷对于问题解决至关重要，然而由于深度学习模型固有的非确定性及其与软硬件环境的紧密耦合，复现过程极具挑战性。近期研究表明，仅约3%的深度学习缺陷可通过人工方法可靠复现。为应对这些挑战，本文提出RepGen——一种新颖、自动化、智能的深度学习缺陷复现方法。RepGen通过构建项目的学习增强上下文，制定全面的缺陷复现计划，采用迭代式的生成-验证-优化机制，最终利用大语言模型生成能够复现目标缺陷的代码。我们在106个真实场景的深度学习缺陷上评估RepGen，实现了80.19%的复现率，较现有最优方法提升19.81%。一项涉及27名开发者的实证研究表明，RepGen将深度学习缺陷复现成功率提高23.35%，复现时间缩短56.8%，并有效降低了参与者的认知负荷。

0

相关内容

深度学习

机器学习的一个分支，它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【博士论文】深度学习中的推理不一致性及其缓解方法

【博士论文】深度学习中的推理不一致性及其缓解方法

专知会员服务

26+阅读 · 2025年4月5日

【斯坦福博士论文】高效鲁棒的深度学习在医学影像和自然语言处理中的应用，112页pdf

【斯坦福博士论文】高效鲁棒的深度学习在医学影像和自然语言处理中的应用，112页pdf

专知会员服务

22+阅读 · 2024年1月27日

「可解释深度学习在神经影像学」中的应用全面综述，109页pdf

「可解释深度学习在神经影像学」中的应用全面综述，109页pdf

专知会员服务

58+阅读 · 2023年7月20日

【2023新书】可解释的深度学习AI:方法和挑战，348页pdf

【2023新书】可解释的深度学习AI:方法和挑战，348页pdf

专知会员服务

168+阅读 · 2023年3月26日

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

专知会员服务

46+阅读 · 2022年5月27日

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

专知会员服务

33+阅读 · 2021年12月5日

【Nvidia干货书】实战深度学习: 使用TensorFlow实践神经网络、计算机视觉、自然语言处理和Transformers

【Nvidia干货书】实战深度学习: 使用TensorFlow实践神经网络、计算机视觉、自然语言处理和Transformers

专知会员服务

65+阅读 · 2021年10月26日

【论文推荐】深度学习中的异常实例检测:综述，Anomalous Instance Detection in Deep Learning: A Survey

【论文推荐】深度学习中的异常实例检测:综述，Anomalous Instance Detection in Deep Learning: A Survey

专知会员服务

97+阅读 · 2020年3月17日

【雪城大学】深度学习中的异常实例检测:综述论文，Anomalous Instance Detection

【雪城大学】深度学习中的异常实例检测:综述论文，Anomalous Instance Detection

专知会员服务

87+阅读 · 2020年3月17日

深度学习算法与架构回顾

深度学习算法与架构回顾

专知会员服务

84+阅读 · 2019年10月20日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

深度学习的GPU：深度学习中使用GPU的经验和建议

深度学习的GPU：深度学习中使用GPU的经验和建议

数据挖掘入门与实战

11+阅读 · 2018年1月3日

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

AI研习社

11+阅读 · 2017年12月16日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Improved Bug Localization with AI Agents Leveraging Hypothesis and Dynamic Cognition

Arxiv

0+阅读 · 2月13日

AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning

Arxiv

0+阅读 · 2月12日

An Empirical Study of the Imbalance Issue in Software Vulnerability Detection

Arxiv

0+阅读 · 2月12日

AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning

Arxiv

0+阅读 · 2月10日

DEEPMED: Building a Medical DeepResearch Agent via Multi-hop Med-Search Data and Turn-Controlled Agentic Training & Inference

Arxiv

0+阅读 · 2月4日

Improving Deep Learning Library Testing with Machine Learning

Arxiv

0+阅读 · 2月3日

DEEPMED: Building a Medical DeepResearch Agent via Multi-hop Med-Search Data and Turn-Controlled Agentic Training & Inference

Arxiv

0+阅读 · 1月26日

Testing Deep Learning Libraries via Neurosymbolic Constraint Learning

Arxiv

0+阅读 · 1月21日

Improved Bug Localization with AI Agents Leveraging Hypothesis and Dynamic Cognition

Arxiv

0+阅读 · 1月18日

May the Feedback Be with You! Unlocking the Power of Feedback-Driven Deep Learning Framework Fuzzing via LLMs

Arxiv

0+阅读 · 1月17日

VIP会员

文章信息

相关主题

最新内容

乌军利用美国“黄蜂”无人机摧毁俄军后勤

乌军利用美国“黄蜂”无人机摧毁俄军后勤

专知会员服务

4+阅读 · 6月7日

《支持作战级人机协同智能的交互式OODA流程》

《支持作战级人机协同智能的交互式OODA流程》

专知会员服务

10+阅读 · 6月7日

《军事地面机动的概率等时分析：未来自适应模型的多方法协同》

《军事地面机动的概率等时分析：未来自适应模型的多方法协同》

专知会员服务

3+阅读 · 6月7日

大语言模型与物联网：大语言模型与物联网融合全面综述

大语言模型与物联网：大语言模型与物联网融合全面综述

专知会员服务

8+阅读 · 6月7日

【伯克利博士论文】基于动作分块策略的强化学习

【伯克利博士论文】基于动作分块策略的强化学习

专知会员服务

2+阅读 · 6月7日

Transformer增强强化学习：通信网络基础与应用综述

Transformer增强强化学习：通信网络基础与应用综述

专知会员服务

2+阅读 · 6月7日

ICML 2026 | SARDI：扩散语言模型的自增强检索

ICML 2026 | SARDI：扩散语言模型的自增强检索

专知会员服务

8+阅读 · 6月6日

长时程具身智能安全综述：机器人操作的跨层分析

长时程具身智能安全综述：机器人操作的跨层分析

专知会员服务

10+阅读 · 6月6日

从“杀伤链”到“杀伤网”：新时代防空反导体系的真正需求

从“杀伤链”到“杀伤网”：新时代防空反导体系的真正需求

专知会员服务

14+阅读 · 6月6日

《锻造军官能力：军官发展的军事训练、学术教育及设计思维导向创新的多维度研究》最新300页

《锻造军官能力：军官发展的军事训练、学术教育及设计思维导向创新的多维度研究》最新300页

专知会员服务

9+阅读 · 6月6日

《国防领域安全采用大语言模型的战略蓝图》

《国防领域安全采用大语言模型的战略蓝图》

专知会员服务

11+阅读 · 6月6日

《对抗性电磁环境下远程巡飞弹作战的保密指挥控制数据链》

《对抗性电磁环境下远程巡飞弹作战的保密指挥控制数据链》

专知会员服务

12+阅读 · 6月6日

CVPR2026奖项公布，谷歌D4RT最佳论文获奖，何恺明ResNet、YOLO获时间检验奖！

CVPR2026奖项公布，谷歌D4RT最佳论文获奖，何恺明ResNet、YOLO获时间检验奖！

专知会员服务

8+阅读 · 6月6日

ICML 2026 | 演化选择的因果建模

ICML 2026 | 演化选择的因果建模

专知会员服务

11+阅读 · 6月5日

综述｜学习式3D表征最新进展与趋势

综述｜学习式3D表征最新进展与趋势

专知会员服务

7+阅读 · 6月5日

相关VIP内容

【博士论文】深度学习中的推理不一致性及其缓解方法

【博士论文】深度学习中的推理不一致性及其缓解方法

专知会员服务

26+阅读 · 2025年4月5日

【斯坦福博士论文】高效鲁棒的深度学习在医学影像和自然语言处理中的应用，112页pdf

【斯坦福博士论文】高效鲁棒的深度学习在医学影像和自然语言处理中的应用，112页pdf

专知会员服务

22+阅读 · 2024年1月27日

「可解释深度学习在神经影像学」中的应用全面综述，109页pdf

「可解释深度学习在神经影像学」中的应用全面综述，109页pdf

专知会员服务

58+阅读 · 2023年7月20日

【2023新书】可解释的深度学习AI:方法和挑战，348页pdf

【2023新书】可解释的深度学习AI:方法和挑战，348页pdf

专知会员服务

168+阅读 · 2023年3月26日

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

专知会员服务

46+阅读 · 2022年5月27日

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

专知会员服务

33+阅读 · 2021年12月5日

【Nvidia干货书】实战深度学习: 使用TensorFlow实践神经网络、计算机视觉、自然语言处理和Transformers

【Nvidia干货书】实战深度学习: 使用TensorFlow实践神经网络、计算机视觉、自然语言处理和Transformers

专知会员服务

65+阅读 · 2021年10月26日

【论文推荐】深度学习中的异常实例检测:综述，Anomalous Instance Detection in Deep Learning: A Survey

【论文推荐】深度学习中的异常实例检测:综述，Anomalous Instance Detection in Deep Learning: A Survey

专知会员服务

97+阅读 · 2020年3月17日

【雪城大学】深度学习中的异常实例检测:综述论文，Anomalous Instance Detection

【雪城大学】深度学习中的异常实例检测:综述论文，Anomalous Instance Detection

专知会员服务

87+阅读 · 2020年3月17日

深度学习算法与架构回顾

深度学习算法与架构回顾

专知会员服务

84+阅读 · 2019年10月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《支持作战级人机协同智能的交互式OODA流程》

大语言模型与物联网：大语言模型与物联网融合全面综述

乌军利用美国“黄蜂”无人机摧毁俄军后勤

《军事地面机动的概率等时分析：未来自适应模型的多方法协同》

相关资讯

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

深度学习的GPU：深度学习中使用GPU的经验和建议

深度学习的GPU：深度学习中使用GPU的经验和建议

数据挖掘入门与实战

11+阅读 · 2018年1月3日

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 回顾

AI研习社

11+阅读 · 2017年12月16日

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

尽早跑通深度学习的实践代码，是入门深度学习的最快途径

算法与数据结构

22+阅读 · 2017年12月13日

相关论文

Improved Bug Localization with AI Agents Leveraging Hypothesis and Dynamic Cognition

Arxiv

0+阅读 · 2月13日

AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning

Arxiv

0+阅读 · 2月12日

An Empirical Study of the Imbalance Issue in Software Vulnerability Detection

Arxiv

0+阅读 · 2月12日

AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning

Arxiv

0+阅读 · 2月10日

DEEPMED: Building a Medical DeepResearch Agent via Multi-hop Med-Search Data and Turn-Controlled Agentic Training & Inference

Arxiv

0+阅读 · 2月4日

Improving Deep Learning Library Testing with Machine Learning

Arxiv

0+阅读 · 2月3日

DEEPMED: Building a Medical DeepResearch Agent via Multi-hop Med-Search Data and Turn-Controlled Agentic Training & Inference

Arxiv

0+阅读 · 1月26日

Testing Deep Learning Libraries via Neurosymbolic Constraint Learning

Arxiv

0+阅读 · 1月21日

Improved Bug Localization with AI Agents Leveraging Hypothesis and Dynamic Cognition

Arxiv

0+阅读 · 1月18日

May the Feedback Be with You! Unlocking the Power of Feedback-Driven Deep Learning Framework Fuzzing via LLMs

Arxiv

0+阅读 · 1月17日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员