Constructing computer-aided design (CAD) models is labor-intensive but essential for engineering and manufacturing. Recent advances in Large Language Models (LLMs) have inspired the LLM-based CAD generation by representing CAD as command sequences. But these methods struggle in practical scenarios because command sequence representation does not support entity selection (e.g. faces or edges), limiting its ability to support complex editing operations such as chamfer or fillet. Further, the discretization of a continuous variable during sketch and extrude operations may result in topological errors. To address these limitations, we present Pointer-CAD, a novel LLM-based CAD generation framework that leverages a pointer-based command sequence representation to explicitly incorporate the geometric information of B-rep models into sequential modeling. In particular, Pointer-CAD decomposes CAD model generation into steps, conditioning the generation of each subsequent step on both the textual description and the B-rep generated from previous steps. Whenever an operation requires the selection of a specific geometric entity, the LLM predicts a Pointer that selects the most feature-consistent candidate from the available set. Such a selection operation also reduces the quantization error in the command sequence-based representation. To support the training of Pointer-CAD, we develop a data annotation pipeline that produces expert-level natural language descriptions and apply it to build a dataset of approximately 575K CAD models. Extensive experimental results demonstrate that Pointer-CAD effectively supports the generation of complex geometric structures and reduces segmentation error to an extremely low level, achieving a significant improvement over prior command sequence methods, thereby significantly mitigating the topological inaccuracies introduced by quantization error.


翻译:计算机辅助设计(CAD)模型的构建过程劳动密集,但对工程与制造至关重要。基于大语言模型(LLM)的CAD生成方法近期取得进展,其将CAD表示为命令序列。然而,这些方法在实际场景中存在局限,因为命令序列表示不支持实体选择(如面或边),从而限制了其支持倒角或圆角等复杂编辑操作的能力。此外,草图绘制与拉伸操作中连续变量的离散化可能导致拓扑错误。为解决这些局限,本文提出Pointer-CAD——一种基于LLM的新型CAD生成框架,其利用基于指针的命令序列表示,将B-rep模型的几何信息显式融入序列建模。具体而言,Pointer-CAD将CAD模型生成分解为多步骤,使每个后续步骤的生成以前序步骤生成的文本描述和B-rep为条件。当操作需要选择特定几何实体时,LLM会预测一个指针,从可用集合中选择特征最一致的候选对象。此类选择操作同时降低了基于命令序列表示中的量化误差。为支持Pointer-CAD的训练,我们开发了可生成专家级自然语言描述的数据标注流程,并据此构建了包含约57.5万个CAD模型的数据集。大量实验结果表明,Pointer-CAD能有效支持复杂几何结构的生成,并将分割误差降至极低水平,较先前的命令序列方法实现显著提升,从而大幅缓解了量化误差引起的拓扑不准确问题。

0
下载
关闭预览

相关内容

《计算机辅助设计》是一份领先的国际期刊,为学术界和工业界提供有关计算机应用于设计的研究和发展的重要论文。计算机辅助设计邀请论文报告新的研究以及新颖或特别重要的应用,在广泛的主题中,跨越所有阶段的设计过程,从概念创造到制造超越。 官网地址:http://dblp.uni-trier.de/db/journals/cad/
《大型语言模型指令调优》综述
专知会员服务
73+阅读 · 2023年8月27日
图节点嵌入(Node Embeddings)概述,9页pdf
专知
15+阅读 · 2020年8月22日
【数字孪生】从CAD数据到数字孪生
产业智能官
22+阅读 · 2019年11月11日
CenterNet:目标即点(代码已开源)
极市平台
25+阅读 · 2019年5月24日
基于模型系统的系统设计
科技导报
10+阅读 · 2019年4月25日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
Stata绘图:简单好用的37条外部命令
R语言中文社区
25+阅读 · 2018年9月22日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
VIP会员
相关VIP内容
相关资讯
图节点嵌入(Node Embeddings)概述,9页pdf
专知
15+阅读 · 2020年8月22日
【数字孪生】从CAD数据到数字孪生
产业智能官
22+阅读 · 2019年11月11日
CenterNet:目标即点(代码已开源)
极市平台
25+阅读 · 2019年5月24日
基于模型系统的系统设计
科技导报
10+阅读 · 2019年4月25日
超像素、语义分割、实例分割、全景分割 傻傻分不清?
计算机视觉life
19+阅读 · 2018年11月27日
Stata绘图:简单好用的37条外部命令
R语言中文社区
25+阅读 · 2018年9月22日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员