LLMs have demonstrated strong performance in data-rich domains such as programming, yet their reliability in engineering tasks remains limited. Circuit analysis--requiring multimodal understanding and precise mathematical reasoning--highlights these challenges. Although Gemini 2.5 Pro shows improved capabilities in diagram interpretation and analog-circuit reasoning, it still struggles to consistently produce correct solutions when given both textual problem descriptions and circuit diagrams. Meanwhile, engineering education demands scalable AI tools capable of generating accurate solutions for applications such as automated homework feedback. This paper presents an enhanced end-to-end circuit problem-solving framework built upon Gemini. We first conduct a systematic benchmark on undergraduate circuit problems and identify two key failure modes: 1) circuit-recognition hallucinations, particularly incorrect source polarity detection, and 2) reasoning-process hallucinations, such as incorrect current direction assumptions. To address recognition errors, we integrate a fine-tuned YOLO detector and OpenCV-based processing to isolate voltage and current sources, enabling Gemini to accurately re-identify source polarities from cropped images. To mitigate reasoning errors, we introduce an ngspice-driven verification loop, in which simulation discrepancies trigger iterative solution refinement with optional HITL feedback. Experimental results demonstrate that the proposed pipeline achieves 97.59% accuracy, substantially outperforming Gemini's baseline of 79.52%. Furthermore, on four variations of hand-drawn circuit diagrams, accuracy improves from 56.06%--71.21% to 93.94%--95.45% with statistically significant gains. These results highlight the robustness, scalability, and practical applicability of the proposed framework for engineering education and real-world circuit analysis tasks.


翻译:大规模语言模型在编程等数据丰富领域展现了强大性能,但其在工程任务中的可靠性仍然有限。电路分析——需要多模态理解和精确数学推理——凸显了这些挑战。尽管Gemini 2.5 Pro在电路图解读和模拟电路推理方面能力有所提升,但在同时给定文本问题描述和电路图时,仍难以持续生成正确解。与此同时,工程教育需要可扩展的AI工具,能够为自动作业反馈等应用生成准确解。本文提出了一种基于Gemini的增强型端到端电路问题求解框架。我们首先对本科级电路问题进行了系统性基准测试,识别出两类关键失效模式:1)电路识别幻觉,特别是错误的电源极性检测;2)推理过程幻觉,例如错误的电流方向假设。为解决识别错误,我们集成了微调的YOLO检测器和基于OpenCV的处理流程来隔离电压源和电流源,使Gemini能够从裁剪图像中准确重新识别电源极性。为减轻推理错误,我们引入了ngspice驱动的验证循环,其中仿真偏差会触发迭代解优化,并可选配人机回环反馈。实验结果表明,所提流水线实现了97.59%的准确率,显著优于Gemini基线的79.52%。此外,在四种手绘电路图变体上,准确率从56.06%–71.21%提升至93.94%–95.45%,且具有统计显著性。这些结果突显了所提框架在工程教育和实际电路分析任务中的鲁棒性、可扩展性和实际适用性。

0
下载
关闭预览

相关内容

【新书】大语言模型如何工作?200页pdf
专知会员服务
60+阅读 · 2025年6月20日
结合知识增强的大型语言模型复杂问题求解综述
专知会员服务
16+阅读 · 2025年5月7日
大语言模型在电力系统中的应用初探
专知会员服务
25+阅读 · 2025年4月7日
大语言模型在规划与调度问题上的应用
专知会员服务
53+阅读 · 2025年1月12日
大规模语言模型增强推荐系统:分类、趋势、应用与未来
专知会员服务
40+阅读 · 2024年12月22日
《高效多模态大型语言模型》综述
专知会员服务
73+阅读 · 2024年5月20日
「知识增强预训练语言模型」最新研究综述
专知
18+阅读 · 2022年11月18日
基于模型系统的系统设计
科技导报
10+阅读 · 2019年4月25日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
25+阅读 · 2023年6月23日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
2+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员