多智能体AI系统的开发与问题：一项大规模实证研究 (A Large-Scale Study on the Development and Issues of Multi-Agent AI Systems) - 专知论文

会员服务 ·

0

系统 · AI · AI系统 · 实证研究 · 分析 ·

A Large-Scale Study on the Development and Issues of Multi-Agent AI Systems

翻译：多智能体AI系统的开发与问题：一项大规模实证研究

Daniel Liu,Krishna Upadhyay,Vinaik Chhetri,A. B. Siddique,Umar Farooq

from arxiv, 8 pages, 8 figures, IEEE BigData Workshop on Software Engineering for Agentic AI 2025

The rapid emergence of multi-agent AI systems (MAS), including LangChain, CrewAI, and AutoGen, has shaped how large language model (LLM) applications are developed and orchestrated. However, little is known about how these systems evolve and are maintained in practice. This paper presents the first large-scale empirical study of open-source MAS, analyzing over 42K unique commits and over 4.7K resolved issues across eight leading systems. Our analysis identifies three distinct development profiles: sustained, steady, and burst-driven. These profiles reflect substantial variation in ecosystem maturity. Perfective commits constitute 40.8% of all changes, suggesting that feature enhancement is prioritized over corrective maintenance (27.4%) and adaptive updates (24.3%). Data about issues shows that the most frequent concerns involve bugs (22%), infrastructure (14%), and agent coordination challenges (10%). Issue reporting also increased sharply across all frameworks starting in 2023. Median resolution times range from under one day to about two weeks, with distributions skewed toward fast responses but a minority of issues requiring extended attention. These results highlight both the momentum and the fragility of the current ecosystem, emphasizing the need for improved testing infrastructure, documentation quality, and maintenance practices to ensure long-term reliability and sustainability.

翻译：多智能体AI系统（MAS）的迅速兴起，包括LangChain、CrewAI和AutoGen等，已经塑造了大型语言模型（LLM）应用的开发与编排方式。然而，对于这些系统在实践中如何演化与维护，目前知之甚少。本文首次对开源MAS进行了大规模实证研究，分析了八个主流系统超过42,000次独立提交和超过4,700个已解决问题。我们的分析识别出三种不同的开发模式：持续型、稳定型和爆发驱动型。这些模式反映了生态系统成熟度的显著差异。完善性提交占所有变更的40.8%，表明功能增强优先于纠正性维护（27.4%）和适应性更新（24.3%）。关于问题的数据显示，最常见的关注点涉及错误（22%）、基础设施（14%）和智能体协调挑战（10%）。从2023年开始，所有框架的问题报告数量均急剧增加。中位解决时间从不足一天到大约两周不等，其分布偏向快速响应，但少数问题需要更长的处理时间。这些结果突显了当前生态系统既充满活力又具有脆弱性的双重特征，强调了改进测试基础设施、文档质量和维护实践的必要性，以确保长期的可靠性和可持续性。

0

相关内容

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

专知会员服务

40+阅读 · 1月8日

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

专知会员服务

31+阅读 · 2025年9月27日

AI智能体编程：技术、挑战与机遇综述

AI智能体编程：技术、挑战与机遇综述

专知会员服务

43+阅读 · 2025年8月18日

智能体引领未来：多智能体推荐系统的定义、视角与开放挑战

智能体引领未来：多智能体推荐系统的定义、视角与开放挑战

专知会员服务

33+阅读 · 2025年7月5日

264页pdf！基础智能体的进展与挑战：从类脑智能到进化式、协作式与安全系统

264页pdf！基础智能体的进展与挑战：从类脑智能到进化式、协作式与安全系统

专知会员服务

66+阅读 · 2025年4月5日

基于大语言模型的智能体优化研究综述

基于大语言模型的智能体优化研究综述

专知会员服务

61+阅读 · 2025年3月25日

可信赖LLM智能体的研究综述：威胁与应对措施

可信赖LLM智能体的研究综述：威胁与应对措施

专知会员服务

36+阅读 · 2025年3月17日

多智能体协作机制：大语言模型综述

多智能体协作机制：大语言模型综述

专知会员服务

68+阅读 · 2025年3月4日

《大型多模态智能体》综述

《大型多模态智能体》综述

专知会员服务

106+阅读 · 2024年2月26日

基于大型语言模型的多智能体：进展与挑战综述

基于大型语言模型的多智能体：进展与挑战综述

专知会员服务

138+阅读 · 2024年2月6日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知

11+阅读 · 2022年11月26日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

58+阅读 · 2022年4月30日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

15+阅读 · 2020年9月9日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

AI综述专栏|多模态学习研究进展综述

AI综述专栏|多模态学习研究进展综述

人工智能前沿讲习班

64+阅读 · 2018年7月13日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构化方法的复杂研发项目多领域集成分析与优化研究

国家自然科学基金

2+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Towards a Science of Collective AI: LLM-based Multi-Agent Systems Need a Transition from Blind Trial-and-Error to Rigorous Science

Arxiv

0+阅读 · 2月5日

On the Uncertainty of Large Language Model-Based Multi-Agent Systems

Arxiv

0+阅读 · 2月4日

Understanding Agent Scaling in LLM-Based Multi-Agent Systems via Diversity

Arxiv

0+阅读 · 2月3日

An Empirical Study of Collective Behaviors and Social Dynamics in Large Language Model Agents

Arxiv

0+阅读 · 2月3日

Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents

Arxiv

0+阅读 · 2月2日

Interpreting Agentic Systems: Beyond Model Explanations to System-Level Accountability

Arxiv

0+阅读 · 1月23日

Exploring Implicit Perspectives on Autism in Large Language Models Through Multi-Agent Simulations

Arxiv

0+阅读 · 1月21日

Game-Theoretic Lens on LLM-based Multi-Agent Systems

Arxiv

0+阅读 · 1月21日

Conformity Dynamics in LLM Multi-Agent Systems: The Roles of Topology and Self-Social Weighting

Arxiv

0+阅读 · 1月9日

LLM-Enabled Multi-Agent Systems: Empirical Evaluation and Insights into Emerging Design Patterns & Paradigms

Arxiv

0+阅读 · 1月6日

VIP会员

文章信息

相关主题

相关VIP内容

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

智能体化人工智能 (Agentic AI) 的前行之路：挑战与机遇

专知会员服务

40+阅读 · 1月8日

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

专知会员服务

31+阅读 · 2025年9月27日

AI智能体编程：技术、挑战与机遇综述

AI智能体编程：技术、挑战与机遇综述

专知会员服务

43+阅读 · 2025年8月18日

智能体引领未来：多智能体推荐系统的定义、视角与开放挑战

智能体引领未来：多智能体推荐系统的定义、视角与开放挑战

专知会员服务

33+阅读 · 2025年7月5日

264页pdf！基础智能体的进展与挑战：从类脑智能到进化式、协作式与安全系统

264页pdf！基础智能体的进展与挑战：从类脑智能到进化式、协作式与安全系统

专知会员服务

66+阅读 · 2025年4月5日

基于大语言模型的智能体优化研究综述

基于大语言模型的智能体优化研究综述

专知会员服务

61+阅读 · 2025年3月25日

可信赖LLM智能体的研究综述：威胁与应对措施

可信赖LLM智能体的研究综述：威胁与应对措施

专知会员服务

36+阅读 · 2025年3月17日

多智能体协作机制：大语言模型综述

多智能体协作机制：大语言模型综述

专知会员服务

68+阅读 · 2025年3月4日

《大型多模态智能体》综述

《大型多模态智能体》综述

专知会员服务

106+阅读 · 2024年2月26日

基于大型语言模型的多智能体：进展与挑战综述

基于大型语言模型的多智能体：进展与挑战综述

专知会员服务

138+阅读 · 2024年2月6日

热门VIP内容

开通专知VIP会员享更多权益服务

伊朗“沙赫德”与美军LUCAS：两款不同无人机解析

《对抗环境中的无人机集群战术研究：俄乌战场分析》最新149页

美军LUCAS与伊朗沙赫德-136无人机全面解析：航程、速度与成本分析

《俄乌战争中的小型无人机应用研究》最新报告130页

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

博弈论视角下的多智能体强化学习综述,129页pdf与76页Slides

专知

11+阅读 · 2022年11月26日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

58+阅读 · 2022年4月30日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

15+阅读 · 2020年9月9日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

AI综述专栏|多模态学习研究进展综述

AI综述专栏|多模态学习研究进展综述

人工智能前沿讲习班

64+阅读 · 2018年7月13日

相关论文

Towards a Science of Collective AI: LLM-based Multi-Agent Systems Need a Transition from Blind Trial-and-Error to Rigorous Science

Arxiv

0+阅读 · 2月5日

On the Uncertainty of Large Language Model-Based Multi-Agent Systems

Arxiv

0+阅读 · 2月4日

Understanding Agent Scaling in LLM-Based Multi-Agent Systems via Diversity

Arxiv

0+阅读 · 2月3日

An Empirical Study of Collective Behaviors and Social Dynamics in Large Language Model Agents

Arxiv

0+阅读 · 2月3日

Towards Scientific Intelligence: A Survey of LLM-based Scientific Agents

Arxiv

0+阅读 · 2月2日

Interpreting Agentic Systems: Beyond Model Explanations to System-Level Accountability

Arxiv

0+阅读 · 1月23日

Exploring Implicit Perspectives on Autism in Large Language Models Through Multi-Agent Simulations

Arxiv

0+阅读 · 1月21日

Game-Theoretic Lens on LLM-based Multi-Agent Systems

Arxiv

0+阅读 · 1月21日

Conformity Dynamics in LLM Multi-Agent Systems: The Roles of Topology and Self-Social Weighting

Arxiv

0+阅读 · 1月9日

LLM-Enabled Multi-Agent Systems: Empirical Evaluation and Insights into Emerging Design Patterns & Paradigms

Arxiv

0+阅读 · 1月6日

相关基金

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构化方法的复杂研发项目多领域集成分析与优化研究

国家自然科学基金

2+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员