LAUDE：基于大语言模型的硬件设计单元测试生成与调试框架 (LAUDE: LLM-Assisted Unit Test Generation and Debugging of Hardware DEsigns) - 专知论文

会员服务 ·

0

设计 · 单元 · 调试 · 测试生成 · 单元测试生成 ·

LAUDE: LLM-Assisted Unit Test Generation and Debugging of Hardware DEsigns

翻译：LAUDE：基于大语言模型的硬件设计单元测试生成与调试框架

Deeksha Nandal,Riccardo Revalor,Soham Dan,Debjit Pal

from arxiv, 18 Pages, 21 Figures, Submitted to ARR Review

Unit tests are critical in the hardware design lifecycle to ensure that component design modules are functionally correct and conform to the specification before they are integrated at the system level. Thus developing unit tests targeting various design features requires deep understanding of the design functionality and creativity. When one or more unit tests expose a design failure, the debugging engineer needs to diagnose, localize, and debug the failure to ensure design correctness, which is often a painstaking and intense process. In this work, we introduce LAUDE, a unified unit-test generation and debugging framework for hardware designs that cross-pollinates the semantic understanding of the design source code with the Chain-of-Thought (CoT) reasoning capabilities of foundational Large-Language Models (LLMs). LAUDE integrates prompt engineering and design execution information to enhance its unit test generation accuracy and code debuggability. We apply LAUDE with closed- and open-source LLMs to a large corpus of buggy hardware design codes derived from the VerilogEval dataset, where generated unit tests detected bugs in up to 100% and 93% of combinational and sequential designs and debugged up to 93% and 84% of combinational and sequential designs, respectively.

翻译：单元测试在硬件设计生命周期中至关重要，以确保组件设计模块在系统级集成前功能正确且符合规范。因此，针对各类设计特性开发单元测试需要深入理解设计功能并具备创造性。当一个或多个单元测试暴露设计故障时，调试工程师需诊断、定位并修复故障以确保设计正确性，这一过程通常耗时费力。本文提出LAUDE，一种面向硬件设计的统一单元测试生成与调试框架，该框架将设计源代码的语义理解与基础大语言模型的思维链推理能力深度融合。LAUDE集成提示工程与设计执行信息，以提升其单元测试生成准确性与代码可调试性。我们采用闭源与开源大语言模型，将LAUDE应用于源自VerilogEval数据集的缺陷硬件设计代码大型语料库。实验表明，生成的单元测试在组合电路与时序电路设计中分别检测出高达100%与93%的缺陷，并分别成功调试了93%与84%的组合电路与时序电路设计。

0

相关内容

设计是对现有状的一种重新认识和打破重组的过程，设计让一切变得更美。

用于单元测试生成的大型语言模型：成果、挑战与未来方向

用于单元测试生成的大型语言模型：成果、挑战与未来方向

专知会员服务

17+阅读 · 2025年11月27日

《基于大型语言模型的软件工程自动化研究》最新264页

《基于大型语言模型的软件工程自动化研究》最新264页

专知会员服务

37+阅读 · 2025年7月14日

【COLING教程】导航现代评估领域：大语言模型 (LLMs) 基准和框架的考量，181页ppt

【COLING教程】导航现代评估领域：大语言模型 (LLMs) 基准和框架的考量，181页ppt

专知会员服务

28+阅读 · 2024年5月31日

机载电子战管理系统（EWMS）开发《加强测试和评估流程：实施敏捷开发、测试自动化和基于模型的系统工程概念》180页

机载电子战管理系统（EWMS）开发《加强测试和评估流程：实施敏捷开发、测试自动化和基于模型的系统工程概念》180页

专知会员服务

59+阅读 · 2024年3月17日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

110+阅读 · 2023年12月19日

【伯克利博士论文】生成片上系统的物理感知设计，153页pdf

【伯克利博士论文】生成片上系统的物理感知设计，153页pdf

专知会员服务

19+阅读 · 2022年12月3日

复杂系统如何检测异常？北卡UNCC等最新《复杂分布式系统中基于图的深度学习异常检测方法综述》，阐述最新图异常检测技术进展

复杂系统如何检测异常？北卡UNCC等最新《复杂分布式系统中基于图的深度学习异常检测方法综述》，阐述最新图异常检测技术进展

专知会员服务

58+阅读 · 2022年6月12日

是时候学习机器学习系统设计了！斯坦福CS 329S开课，课件、笔记同步更新

是时候学习机器学习系统设计了！斯坦福CS 329S开课，课件、笔记同步更新

专知会员服务

40+阅读 · 2021年1月27日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

【CCF优秀博士学位论文奖-2019】数据驱动的编译器测试与调试若干技术研究，北京大学陈俊洁

【CCF优秀博士学位论文奖-2019】数据驱动的编译器测试与调试若干技术研究，北京大学陈俊洁

专知会员服务

11+阅读 · 2019年11月8日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

元学习—Meta Learning的兴起

元学习—Meta Learning的兴起

专知

44+阅读 · 2019年10月19日

【数字孪生】使用数字孪生体进行预测性维护

【数字孪生】使用数字孪生体进行预测性维护

产业智能官

28+阅读 · 2019年7月22日

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

专知

48+阅读 · 2019年5月10日

一个牛逼的 Python 调试工具

一个牛逼的 Python 调试工具

机器学习算法与Python学习

15+阅读 · 2019年4月30日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

我所了解的物联网设备测试方法（硬件篇）

我所了解的物联网设备测试方法（硬件篇）

FreeBuf

12+阅读 · 2019年2月12日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

《软件方法》1-8章全部自测题更新内容

《软件方法》1-8章全部自测题更新内容

UMLChina

11+阅读 · 2018年3月26日

【智能制造】设备故障诊断基础知识：振动、噪声、温度、探伤

【智能制造】设备故障诊断基础知识：振动、噪声、温度、探伤

产业智能官

13+阅读 · 2017年12月24日

支持新产品快速设计的复杂产品系统功能模块化方法

国家自然科学基金

1+阅读 · 2015年12月31日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

初级组装体的模块化组装、功能集成与仿生应用

国家自然科学基金

0+阅读 · 2015年12月31日

类簇级测试中类测试序的生成技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

一种低功耗高压缩率测试图形生成方法的实现与应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

千万自由度量级并行有限元模态和振动分析软件研发

国家自然科学基金

0+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

SPARC: Scenario Planning and Reasoning for Automated C Unit Test Generation

SPARC: Scenario Planning and Reasoning for Automated C Unit Test Generation

Arxiv

0+阅读 · 2月18日

Mutation-Guided Unit Test Generation with a Large Language Model

Mutation-Guided Unit Test Generation with a Large Language Model

Arxiv

0+阅读 · 2月17日

Automated Test Suite Enhancement Using Large Language Models with Few-shot Prompting

Arxiv

0+阅读 · 2月12日

Test vs Mutant: Adversarial LLM Agents for Robust Unit Test Generation

Arxiv

0+阅读 · 2月10日

Test vs Mutant: Adversarial LLM Agents for Robust Unit Test Generation

Arxiv

0+阅读 · 2月8日

KTester: Leveraging Domain and Testing Knowledge for More Effective LLM-based Test Generation

Arxiv

0+阅读 · 2月6日

Synthesizing File-Level Data for Unit Test Generation with Chain-of-Thoughts via Self-Debugging

Arxiv

0+阅读 · 2月3日

Understanding Bug-Reproducing Tests: A First Empirical Study

Arxiv

0+阅读 · 2月3日

ChipBench: A Next-Step Benchmark for Evaluating LLM Performance in AI-Aided Chip Design

Arxiv

0+阅读 · 1月29日

SWE-Tester: Training Open-Source LLMs for Issue Reproduction in Real-World Repositories

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

单元测试生成

相关VIP内容

用于单元测试生成的大型语言模型：成果、挑战与未来方向

用于单元测试生成的大型语言模型：成果、挑战与未来方向

专知会员服务

17+阅读 · 2025年11月27日

《基于大型语言模型的软件工程自动化研究》最新264页

《基于大型语言模型的软件工程自动化研究》最新264页

专知会员服务

37+阅读 · 2025年7月14日

【COLING教程】导航现代评估领域：大语言模型 (LLMs) 基准和框架的考量，181页ppt

【COLING教程】导航现代评估领域：大语言模型 (LLMs) 基准和框架的考量，181页ppt

专知会员服务

28+阅读 · 2024年5月31日

机载电子战管理系统（EWMS）开发《加强测试和评估流程：实施敏捷开发、测试自动化和基于模型的系统工程概念》180页

机载电子战管理系统（EWMS）开发《加强测试和评估流程：实施敏捷开发、测试自动化和基于模型的系统工程概念》180页

专知会员服务

59+阅读 · 2024年3月17日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

110+阅读 · 2023年12月19日

【伯克利博士论文】生成片上系统的物理感知设计，153页pdf

【伯克利博士论文】生成片上系统的物理感知设计，153页pdf

专知会员服务

19+阅读 · 2022年12月3日

复杂系统如何检测异常？北卡UNCC等最新《复杂分布式系统中基于图的深度学习异常检测方法综述》，阐述最新图异常检测技术进展

复杂系统如何检测异常？北卡UNCC等最新《复杂分布式系统中基于图的深度学习异常检测方法综述》，阐述最新图异常检测技术进展

专知会员服务

58+阅读 · 2022年6月12日

是时候学习机器学习系统设计了！斯坦福CS 329S开课，课件、笔记同步更新

是时候学习机器学习系统设计了！斯坦福CS 329S开课，课件、笔记同步更新

专知会员服务

40+阅读 · 2021年1月27日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

【CCF优秀博士学位论文奖-2019】数据驱动的编译器测试与调试若干技术研究，北京大学陈俊洁

【CCF优秀博士学位论文奖-2019】数据驱动的编译器测试与调试若干技术研究，北京大学陈俊洁

专知会员服务

11+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

元学习—Meta Learning的兴起

元学习—Meta Learning的兴起

专知

44+阅读 · 2019年10月19日

【数字孪生】使用数字孪生体进行预测性维护

【数字孪生】使用数字孪生体进行预测性维护

产业智能官

28+阅读 · 2019年7月22日

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

专知

48+阅读 · 2019年5月10日

一个牛逼的 Python 调试工具

一个牛逼的 Python 调试工具

机器学习算法与Python学习

15+阅读 · 2019年4月30日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

我所了解的物联网设备测试方法（硬件篇）

我所了解的物联网设备测试方法（硬件篇）

FreeBuf

12+阅读 · 2019年2月12日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

《软件方法》1-8章全部自测题更新内容

《软件方法》1-8章全部自测题更新内容

UMLChina

11+阅读 · 2018年3月26日

【智能制造】设备故障诊断基础知识：振动、噪声、温度、探伤

【智能制造】设备故障诊断基础知识：振动、噪声、温度、探伤

产业智能官

13+阅读 · 2017年12月24日

相关论文

SPARC: Scenario Planning and Reasoning for Automated C Unit Test Generation

SPARC: Scenario Planning and Reasoning for Automated C Unit Test Generation

Arxiv

0+阅读 · 2月18日

Mutation-Guided Unit Test Generation with a Large Language Model

Mutation-Guided Unit Test Generation with a Large Language Model

Arxiv

0+阅读 · 2月17日

Automated Test Suite Enhancement Using Large Language Models with Few-shot Prompting

Arxiv

0+阅读 · 2月12日

Test vs Mutant: Adversarial LLM Agents for Robust Unit Test Generation

Arxiv

0+阅读 · 2月10日

Test vs Mutant: Adversarial LLM Agents for Robust Unit Test Generation

Arxiv

0+阅读 · 2月8日

KTester: Leveraging Domain and Testing Knowledge for More Effective LLM-based Test Generation

Arxiv

0+阅读 · 2月6日

Synthesizing File-Level Data for Unit Test Generation with Chain-of-Thoughts via Self-Debugging

Arxiv

0+阅读 · 2月3日

Understanding Bug-Reproducing Tests: A First Empirical Study

Arxiv

0+阅读 · 2月3日

ChipBench: A Next-Step Benchmark for Evaluating LLM Performance in AI-Aided Chip Design

Arxiv

0+阅读 · 1月29日

SWE-Tester: Training Open-Source LLMs for Issue Reproduction in Real-World Repositories

Arxiv

0+阅读 · 1月20日

相关基金

支持新产品快速设计的复杂产品系统功能模块化方法

国家自然科学基金

1+阅读 · 2015年12月31日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

初级组装体的模块化组装、功能集成与仿生应用

国家自然科学基金

0+阅读 · 2015年12月31日

类簇级测试中类测试序的生成技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

一种低功耗高压缩率测试图形生成方法的实现与应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

千万自由度量级并行有限元模态和振动分析软件研发

国家自然科学基金

0+阅读 · 2014年12月31日

支持软件可信演化的故障定位研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员