Software architecture design is a critical yet inherently complex and knowledge-intensive phase that requires balancing competing quality attributes and adapting to evolving requirements. Traditionally, this process has been time-consuming, labor-intensive, and heavily reliant on architects, often resulting in limited exploration of alternative architectural decompositions and styles, especially under the pressures of agile development. While LLM-based agents have shown promising performance across various software engineering tasks, their application to architecture design remains relatively scarce and requires systematic exploration. To address these challenges, we proposed MAAD (Multi-Agent Architecture Design), a knowledge-driven framework that orchestrates four specialized agents (i.e., Analyst, Modeler, Designer and Evaluator) to autonomously and collaboratively transform requirements specifications into comprehensive, multi-view architectural blueprints with quality attribute assessments. MAAD incorporates RAG to inject recognized architectural standards and patterns into the workflow and leverages a hierarchical memory mechanism that captures design history for iterative refinement. We evaluated MAAD through comparative experiments against MetaGPT, using quantitative architecture-level metrics across 10 case studies and qualitative feedback from industry architects on 10 real-world specifications. Results show that MAAD generates more complete, modular, and traceable architectures than the baseline, and its dedicated Evaluator agent autonomously produces structured quality evaluation reports that significantly reduce manual validation efforts. Furthermore, we found that the quality of the generated architecture heavily depends on the underlying LLM's reasoning capacity, with GPT-5.2 and Qwen3.5 outperforming other models across most evaluation settings.


翻译:软件架构设计是一个关键但本质上复杂且知识密集的环节,需要平衡相互竞争的质量属性并适应不断变化的需求。传统上,这一过程耗时、劳动密集且高度依赖架构师,尤其在敏捷开发的压力下,往往导致对备选架构分解与风格的探索有限。尽管基于大语言模型(LLM)的智能体已在各类软件工程任务中展现出良好性能,但其在架构设计中的应用仍相对稀少,亟需系统性探索。为解决这些挑战,我们提出了MAAD(多智能体架构设计)——一种知识驱动的框架,它编排四个专精智能体(即分析师、建模师、设计者与评估者),以自主协作方式将需求规格说明转化为附带质量属性评估的综合多视角架构蓝图。MAAD引入RAG(检索增强生成)将公认的架构标准与模式注入工作流程,并利用层级记忆机制捕获设计历史以实现迭代优化。我们通过对比实验对MAAD进行评估:基于10个案例研究,使用定量架构级指标将其与MetaGPT比较,并收集了工业界架构师针对10项真实世界规格说明的定性反馈。结果表明,相比基线方法,MAAD生成的架构更完整、模块化且可追溯;其专用评估智能体可自主生成结构化的质量评估报告,显著减少人工验证工作量。此外,我们发现生成架构的质量高度依赖于底层LLM的推理能力,在多数评估设置中,GPT-5.2与Qwen3.5的性能优于其他模型。

0
下载
关闭预览

相关内容

设计是对现有状的一种重新认识和打破重组的过程,设计让一切变得更美。
AgentOps综述:智能体系统运维框架
专知会员服务
18+阅读 · 6月4日
智能体技能综合综述:分类、技术与应用
专知会员服务
33+阅读 · 5月11日
AI智能体编程:技术、挑战与机遇综述
专知会员服务
48+阅读 · 2025年8月18日
《大语言模型智能体:方法、应用与挑战综述》
专知会员服务
62+阅读 · 2025年3月28日
【WWW2024教程】大型语言模型驱动智能体,附slides
专知会员服务
64+阅读 · 2024年5月14日
重磅!AI框架发展白皮书(2022年),44页pdf
专知
28+阅读 · 2022年2月27日
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
31+阅读 · 2019年7月6日
面向人工智能的计算机体系结构
计算机研究与发展
14+阅读 · 2019年6月6日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
Arxiv
11+阅读 · 2023年8月28日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
4+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
6+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 6月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员