Existing API-based agentic systems for RTL code generation are fundamentally misaligned with industrial practice: they assume a golden testbench is available at generation time, rely on closed-source APIs incompatible with chip vendors' air-gapped security requirements, and cannot be trained on vendors' proprietary RTL codebases, leaving valuable internal data unused. Recent self-trained models address the deployment constraint but remain single-turn generators that overlook the critical role of verification in real industrial flows. To bridge these gaps, we present ChipMATE, the first self-trained multi-agent framework for RTL generation. Inspired by industrial practice where correctness emerges from cross-comparison between independently written RTL modules and reference models, ChipMATE pairs a Verilog agent with a Python reference-model agent that mutually verify each other's outputs without any golden oracle. We design a backtrack-based inference workflow to prevent error propagation across turns, and a two-stage training pipeline that first trains each agent individually to saturate its code-generation capability, then trains the team jointly to collaborate effectively. To support the training, we further build a hybrid data-generation framework that produces 64.4K high-quality reference model training samples. ChipMATE achieves 75.0\% and 80.1\% pass@1 on VerilogEval V2 with 4B and 9B base models, outperforming all existing self-trained models and even DeepSeek V4 with 1600B parameters. Our code and model weights are publicly available in https://github.com/zhongkaiyu/ChipMATE.


翻译:现有基于API的RTL代码生成智能体系统与工业实践存在根本性脱节:它们假设在生成时即存在黄金测试平台,依赖与芯片供应商气隙安全要求不兼容的闭源API,且无法在供应商专有RTL代码库上训练,导致宝贵的内部数据未被利用。近期自训练模型虽解决了部署约束问题,但仍属于单轮生成器,忽视了验证在实际工业流程中的关键作用。为弥合这些差距,我们提出ChipMATE——首个用于RTL生成的自训练多智能体框架。受工业实践中通过独立编写的RTL模块与参考模型交叉比对产生正确性的启发,ChipMATE将Verilog智能体与Python参考模型智能体配对,使两者在无任何黄金标准的情况下相互验证彼此输出。我们设计了基于回溯推理的工作流以防止错误跨轮传播,并构建了两阶段训练流水线:首先单独训练每个智能体以饱和其代码生成能力,随后联合训练团队以实现高效协作。为支撑训练,我们进一步构建了混合数据生成框架,产生了64.4K高质量参考模型训练样本。ChipMATE在采用4B和9B基础模型时,于VerilogEval V2上分别达到75.0%和80.1%的pass@1指标,超越了所有现有自训练模型,甚至包括拥有1600B参数的DeepSeek V4。我们的代码和模型权重已在https://github.com/zhongkaiyu/ChipMATE公开。

0
下载
关闭预览

相关内容

代码(Code)是专知网的一个重要知识资料文档板块,旨在整理收录论文源代码、复现代码,经典工程代码等,便于用户查阅下载使用。
智能体工程(Agent Engineering)
专知会员服务
36+阅读 · 2025年12月31日
多智能体强化学习中的稳健且高效的通信
专知会员服务
25+阅读 · 2025年11月17日
多智能体深度强化学习研究进展
专知会员服务
76+阅读 · 2024年7月17日
《用于空战机动的分层多智能体强化学习》
专知会员服务
69+阅读 · 2023年10月5日
《网络战仿真中的多智能体强化学习》最新42页报告
专知会员服务
47+阅读 · 2023年7月11日
基于通信的多智能体强化学习进展综述
专知会员服务
112+阅读 · 2022年11月12日
专知会员服务
214+阅读 · 2019年8月30日
「基于通信的多智能体强化学习」 进展综述
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
16+阅读 · 2020年9月9日
多智能体强化学习(MARL)近年研究概览
PaperWeekly
38+阅读 · 2020年3月15日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
36+阅读 · 2008年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 49分钟前
定向能反无人机系统最新发展动态
专知会员服务
3+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
2+阅读 · 今天13:33
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
19+阅读 · 2012年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
国家自然科学基金
36+阅读 · 2008年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员