Computer-Aided Design is pivotal in modern manufacturing, yet existing automated methods predominantly rely on open-loop, one-shot generation, creating a mismatch with iterative real-world practices. In this paper, we present IterCAD, a unified multimodal agent framework for closed-loop, interactive CAD generation and editing. We formulate the task as a multi-turn interaction between a multimodal agent and an executable CAD sandbox, covering three tasks: Drawing-to-Code, Text-to-Code, and Interactive Editing. To support this, we develop a data synthesis pipeline incorporating advanced industrial manufacturing features to generate standard-compliant multi-view engineering drawings, complex code-editing tasks, and high-fidelity interaction trajectories. We optimize the agent via progressive SFT followed by geometry-aware reinforcement learning with viable-prefix masking to enhance code executability and geometric fidelity. Finally, we introduce the IterCAD-Bench evaluation suite and propose the Chamfer Distance Tolerance-Recall (CD-TR) curve alongside its AUC-TR metric, establishing a survivor-bias-free standard that unifies code validity and geometric precision. Extensive experiments demonstrate that IterCAD achieves highly competitive performance across multiple benchmarks, significantly outperforming existing approaches in both code executability and geometric precision, while exhibiting superior capabilities in closed-loop iterative refinement.


翻译:计算机辅助设计在现代制造业中至关重要,然而现有自动化方法主要依赖开环式的单次生成,与工业实践中迭代式的设计流程存在显著脱节。本文提出IterCAD——一种面向闭环交互式CAD生成与编辑的统一多模态智能体框架。我们将该任务建模为多模态智能体与可执行CAD沙箱之间的多轮交互,涵盖三类任务:图纸转代码、文本转代码和交互式编辑。为此,我们开发了融合先进工业制造特征的数据合成流水线,用于生成符合标准的二维多视图工程图纸、复杂代码编辑任务及高保真交互轨迹。通过渐进式监督微调结合基于几何感知强化学习的技术,并利用可行前缀掩码增强代码可执行性与几何保真度,我们对智能体进行优化。最后,我们提出IterCAD-Bench评估套件,并引入卡姆距离容错-召回曲线及其AUC-TR指标,建立了无生存偏差的标准化评估体系,统一考量代码有效性与几何精度。大量实验表明,IterCAD在多个基准测试中均展现出极具竞争力的性能,在代码可执行性和几何精度上显著优于现有方法,并具备优异的闭环迭代优化能力。

0
下载
关闭预览

相关内容

AI 智能体系统:体系架构、应用场景及评估范式
智能体工程(Agent Engineering)
专知会员服务
36+阅读 · 2025年12月31日
智能化软件开发落地实践指南(2024年),58页pdf
专知会员服务
59+阅读 · 2024年10月3日
面向人工智能的计算机体系结构
计算机研究与发展
14+阅读 · 2019年6月6日
【仿真】国内外CAE软件的差距及自主路
产业智能官
32+阅读 · 2018年12月20日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
推荐|caffe-orc主流ocr算法:CNN+BLSTM+CTC架构实现!
全球人工智能
19+阅读 · 2017年10月29日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
AI 智能体系统:体系架构、应用场景及评估范式
智能体工程(Agent Engineering)
专知会员服务
36+阅读 · 2025年12月31日
智能化软件开发落地实践指南(2024年),58页pdf
专知会员服务
59+阅读 · 2024年10月3日
相关资讯
面向人工智能的计算机体系结构
计算机研究与发展
14+阅读 · 2019年6月6日
【仿真】国内外CAE软件的差距及自主路
产业智能官
32+阅读 · 2018年12月20日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
推荐|caffe-orc主流ocr算法:CNN+BLSTM+CTC架构实现!
全球人工智能
19+阅读 · 2017年10月29日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员