Towards a Neural Debugger for Python - 专知论文

会员服务 ·

0

调试 · 调试器 · 代码 · Python · 神经解释器 ·

Towards a Neural Debugger for Python

翻译：面向Python的神经调试器

Maximilian Beck,Jonas Gehring,Jannik Kossen,Gabriel Synnaeve

from arxiv, 22 pages

Training large language models (LLMs) on Python execution traces grounds them in code execution and enables the line-by-line execution prediction of whole Python programs, effectively turning them into neural interpreters (FAIR CodeGen Team et al., 2025). However, developers rarely execute programs step by step; instead, they use debuggers to stop execution at certain breakpoints and step through relevant portions only while inspecting or modifying program variables. Existing neural interpreter approaches lack such interactive control. To address this limitation, we introduce neural debuggers: language models that emulate traditional debuggers, supporting operations such as stepping into, over, or out of functions, as well as setting breakpoints at specific source lines. We show that neural debuggers -- obtained via fine-tuning large LLMs or pre-training smaller models from scratch -- can reliably model both forward execution (predicting future states and outputs) and inverse execution (inferring prior states or inputs) conditioned on debugger actions. Evaluated on CruxEval, our models achieve strong performance on both output and input prediction tasks, demonstrating robust conditional execution modeling. Our work takes first steps towards future agentic coding systems in which neural debuggers serve as a world model for simulated debugging environments, providing execution feedback or enabling agents to interact with real debugging tools. This capability lays the foundation for more powerful code generation, program understanding, and automated debugging.

翻译：通过在Python执行轨迹上训练大语言模型（LLM），可使其基于代码执行过程，实现对完整Python程序的逐行执行预测，从而将其转化为神经解释器（FAIR CodeGen Team等人，2025年）。然而，开发者很少逐步执行程序；相反，他们使用调试器在特定断点处暂停执行，仅单步跟踪相关代码段，同时检查或修改变量值。现有的神经解释器方法缺乏此类交互控制能力。为突破这一局限，我们提出神经调试器：一种模拟传统调试器的语言模型，支持步入、步过、步出函数等操作，并能在特定源代码行设置断点。研究表明，通过微调大型LLM或从头预训练较小模型获得的神经调试器，能够可靠地建模正向执行（预测未来状态与输出）与逆向执行（推断先前状态或输入），且该建模过程以调试器操作为条件。在CruxEval基准上的评估显示，我们的模型在输出预测与输入预测任务中均表现优异，展现了稳健的条件执行建模能力。本研究为未来智能编码系统迈出关键一步：神经调试器可作为模拟调试环境的世界模型，提供执行反馈或使智能体能够与真实调试工具交互。该能力为更强大的代码生成、程序理解与自动化调试奠定了基石。

0

相关内容

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

专知会员服务

17+阅读 · 2025年12月10日

【新书】《学习AI辅助的Python编程（第2版）》

【新书】《学习AI辅助的Python编程（第2版）》

专知会员服务

69+阅读 · 2024年10月22日

掌握使用Python的大型语言模型

掌握使用Python的大型语言模型

专知会员服务

63+阅读 · 2024年5月22日

【新书介绍】《Python人工智能》Artificial Intelligence with Python

【新书介绍】《Python人工智能》Artificial Intelligence with Python

专知会员服务

32+阅读 · 2022年3月25日

【教程】深度学习Keras与TensorFlow教程，Deep Learning with Keras and Tensorflow in R

【教程】深度学习Keras与TensorFlow教程，Deep Learning with Keras and Tensorflow in R

专知会员服务

32+阅读 · 2022年3月9日

【干货书】Python机器学习，361页pdf

【干货书】Python机器学习，361页pdf

专知会员服务

272+阅读 · 2021年2月25日

【新书】人工智能Python代码，227页pdf，Python code for Artificial Intelligence: Foundations of Computational Agents

【新书】人工智能Python代码，227页pdf，Python code for Artificial Intelligence: Foundations of Computational Agents

专知会员服务

108+阅读 · 2020年6月21日

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

专知会员服务

70+阅读 · 2020年4月4日

【新书】使用基于python的深度学习开始异常检测，Pytorch与Keras；Beginning Anomaly Detection Using Python-Based Deep Learning

【新书】使用基于python的深度学习开始异常检测，Pytorch与Keras；Beginning Anomaly Detection Using Python-Based Deep Learning

专知会员服务

143+阅读 · 2020年1月13日

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

专知会员服务

53+阅读 · 2020年1月1日

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

CSDN

12+阅读 · 2023年4月13日

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

专知

26+阅读 · 2020年5月15日

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

专知

44+阅读 · 2020年4月4日

将Python用于NLP：Pattern 库简介

将Python用于NLP：Pattern 库简介

Python程序员

15+阅读 · 2019年6月7日

一个牛逼的 Python 调试工具

一个牛逼的 Python 调试工具

机器学习算法与Python学习

15+阅读 · 2019年4月30日

Python 神经网络编程

Python 神经网络编程

人工智能头条

10+阅读 · 2019年2月27日

福利 | 当Python遇上大数据与机器学习，入门so easy！

福利 | 当Python遇上大数据与机器学习，入门so easy！

DBAplus社群

14+阅读 · 2018年3月11日

【下载】面向Python深度学习实战书籍《Deep Learning with Python》

【下载】面向Python深度学习实战书籍《Deep Learning with Python》

专知

37+阅读 · 2017年12月12日

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

AI100

13+阅读 · 2017年11月28日

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

专知

29+阅读 · 2017年11月26日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于生物网络的高维多目标算法及其在分布式调度中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

可重构的环境自适应RS码软判决译码器研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

An Investigation Into Secondary School Students' Debugging Behaviour in Python

Arxiv

0+阅读 · 4月2日

Exploring the Agentic Frontier of Verilog Code Generation

Arxiv

0+阅读 · 3月30日

PIM-SHERPA: Software Method for On-device LLM Inference by Resolving PIM Memory Attribute and Layout Inconsistencies

Arxiv

0+阅读 · 3月10日

NeuroProlog: Multi-Task Fine-Tuning for Neurosymbolic Mathematical Reasoning via the Cocktail Effect

Arxiv

0+阅读 · 3月4日

Agentic Code Reasoning

Arxiv

0+阅读 · 3月4日

R1-Code-Interpreter: LLMs Reason with Code via Supervised and Multi-stage Reinforcement Learning

Arxiv

0+阅读 · 3月3日

Learning to Draft: Adaptive Speculative Decoding with Reinforcement Learning

Arxiv

0+阅读 · 3月2日

Agnostics: Learning to Code in Any Programming Language via Reinforcement with a Universal Learning Environment

Arxiv

0+阅读 · 2月28日

A Benchmark for Deep Information Synthesis

Arxiv

0+阅读 · 2月24日

Debug2Fix: Supercharging Coding Agents with Interactive Debugging Capabilities

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

神经解释器

最新内容

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

4+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

6+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

5+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

6+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

4+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

6+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

6+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

8+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

9+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

13+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

11+阅读 · 7月18日

相关VIP内容

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

专知会员服务

17+阅读 · 2025年12月10日

【新书】《学习AI辅助的Python编程（第2版）》

【新书】《学习AI辅助的Python编程（第2版）》

专知会员服务

69+阅读 · 2024年10月22日

掌握使用Python的大型语言模型

掌握使用Python的大型语言模型

专知会员服务

63+阅读 · 2024年5月22日

【新书介绍】《Python人工智能》Artificial Intelligence with Python

【新书介绍】《Python人工智能》Artificial Intelligence with Python

专知会员服务

32+阅读 · 2022年3月25日

【教程】深度学习Keras与TensorFlow教程，Deep Learning with Keras and Tensorflow in R

【教程】深度学习Keras与TensorFlow教程，Deep Learning with Keras and Tensorflow in R

专知会员服务

32+阅读 · 2022年3月9日

【干货书】Python机器学习，361页pdf

【干货书】Python机器学习，361页pdf

专知会员服务

272+阅读 · 2021年2月25日

【新书】人工智能Python代码，227页pdf，Python code for Artificial Intelligence: Foundations of Computational Agents

【新书】人工智能Python代码，227页pdf，Python code for Artificial Intelligence: Foundations of Computational Agents

专知会员服务

108+阅读 · 2020年6月21日

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

专知会员服务

70+阅读 · 2020年4月4日

【新书】使用基于python的深度学习开始异常检测，Pytorch与Keras；Beginning Anomaly Detection Using Python-Based Deep Learning

【新书】使用基于python的深度学习开始异常检测，Pytorch与Keras；Beginning Anomaly Detection Using Python-Based Deep Learning

专知会员服务

143+阅读 · 2020年1月13日

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

专知会员服务

53+阅读 · 2020年1月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

印度精确打击与指挥架构的断层

美空军AI完成F-16战斗机自主空战历史性试飞

相关资讯

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

CSDN

12+阅读 · 2023年4月13日

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

专知

26+阅读 · 2020年5月15日

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

【干货书】用Python进行深思熟虑的机器学习, 216页pdf，Thoughtful ML with Python

专知

44+阅读 · 2020年4月4日

将Python用于NLP：Pattern 库简介

将Python用于NLP：Pattern 库简介

Python程序员

15+阅读 · 2019年6月7日

一个牛逼的 Python 调试工具

一个牛逼的 Python 调试工具

机器学习算法与Python学习

15+阅读 · 2019年4月30日

Python 神经网络编程

Python 神经网络编程

人工智能头条

10+阅读 · 2019年2月27日

福利 | 当Python遇上大数据与机器学习，入门so easy！

福利 | 当Python遇上大数据与机器学习，入门so easy！

DBAplus社群

14+阅读 · 2018年3月11日

【下载】面向Python深度学习实战书籍《Deep Learning with Python》

【下载】面向Python深度学习实战书籍《Deep Learning with Python》

专知

37+阅读 · 2017年12月12日

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

资源 | 想用Python学机器学习？Google大神替你写好了所有的编程示范代码

AI100

13+阅读 · 2017年11月28日

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

专知

29+阅读 · 2017年11月26日

相关论文

An Investigation Into Secondary School Students' Debugging Behaviour in Python

Arxiv

0+阅读 · 4月2日

Exploring the Agentic Frontier of Verilog Code Generation

Arxiv

0+阅读 · 3月30日

PIM-SHERPA: Software Method for On-device LLM Inference by Resolving PIM Memory Attribute and Layout Inconsistencies

Arxiv

0+阅读 · 3月10日

NeuroProlog: Multi-Task Fine-Tuning for Neurosymbolic Mathematical Reasoning via the Cocktail Effect

Arxiv

0+阅读 · 3月4日

Agentic Code Reasoning

Arxiv

0+阅读 · 3月4日

R1-Code-Interpreter: LLMs Reason with Code via Supervised and Multi-stage Reinforcement Learning

Arxiv

0+阅读 · 3月3日

Learning to Draft: Adaptive Speculative Decoding with Reinforcement Learning

Arxiv

0+阅读 · 3月2日

Agnostics: Learning to Code in Any Programming Language via Reinforcement with a Universal Learning Environment

Arxiv

0+阅读 · 2月28日

A Benchmark for Deep Information Synthesis

Arxiv

0+阅读 · 2月24日

Debug2Fix: Supercharging Coding Agents with Interactive Debugging Capabilities

Arxiv

0+阅读 · 2月20日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于生物网络的高维多目标算法及其在分布式调度中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

可重构的环境自适应RS码软判决译码器研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员