基于大语言模型的多智能体系统因其在推理、规划及生成类人响应方面的能力而日益受到重视。虽然多智能体系统的研究重点多集中于部分可观测性、异构任务分配及其他协作范式等方面,但确保其可靠性与鲁棒性仍是一个关键挑战,尤其是在高风险应用中。本研究将多智能体决策制定构建为一个冗余与容错问题,通过部署多个智能体来解决相同的任务。通过在包括资源分配、问答、主题分类和摘要在内的基准问题上进行实验,我们发现,较简单的策略,如“多数表决”和“去中心化架构”,在一致性方面往往优于更复杂的基于反馈的系统。反馈机制尽管精巧,却存在误差传播和系统失稳的风险,这凸显了独立决策与结果聚合的价值。这些发现强调了在设计用于工业及关键任务型应用的鲁棒多智能体大语言模型系统时,平衡简洁性与可靠性的重要性。
本文通过涉及大语言模型智能体的多个问题来探讨这些挑战,具体包括1) 资源分配,2) 问答,3) 主题分类和4) 摘要,作为一项初步研究。资源分配问题是工业运营中一个关键且广泛适用的领域。同时,问答、主题分类和文本摘要问题是自然语言处理中的经典任务。评估了多种多智能体聚合策略,旨在找出能在不牺牲系统准确性性能的前提下提升可靠性的方法。通过实证实验,举例说明了增加架构复杂性并不一定能提高可靠性,从而强调了在精巧性与鲁棒性之间取得平衡的重要性。本文能为设计可靠的多智能体大语言模型系统提供见解,并为在工业环境中部署基于多智能体大语言模型系统的日益增长的研究贡献一份力量。