SYMPHONY: Synergistic Multi-agent Planning with Heterogeneous Language Model Assembly - 专知论文

会员服务 ·

0

异构 · 智能体 · 多智能体规划 · 语言模型 · 协同 ·

SYMPHONY: Synergistic Multi-agent Planning with Heterogeneous Language Model Assembly

翻译：SYMPHONY：基于异构语言模型组合的协同多智能体规划

Wei Zhu,Zhiwen Tang,Kun Yue

from arxiv, Accepted by NeurIPS 2025

Recent advancements have increasingly focused on leveraging large language models (LLMs) to construct autonomous agents for complex problem-solving tasks. However, existing approaches predominantly employ a single-agent framework to generate search branches and estimate rewards during Monte Carlo Tree Search (MCTS) planning. This single-agent paradigm inherently limits exploration capabilities, often resulting in insufficient diversity among generated branches and suboptimal planning performance. To overcome these limitations, we propose Synergistic Multi-agent Planning with Heterogeneous langauge model assembly (SYMPHONY), a novel multi-agent planning framework that integrates a pool of heterogeneous language model-based agents. By leveraging diverse reasoning patterns across agents, SYMPHONY enhances rollout diversity and facilitates more effective exploration. Empirical results across multiple benchmark tasks show that SYMPHONY achieves strong performance even when instantiated with open-source LLMs deployable on consumer-grade hardware. When enhanced with cloud-based LLMs accessible via API, SYMPHONY demonstrates further improvements, outperforming existing state-of-the-art baselines and underscoring the effectiveness of heterogeneous multi-agent coordination in planning tasks.

翻译：近年来，研究重点日益聚焦于利用大语言模型（LLM）构建自主智能体以完成复杂问题求解任务。然而，现有方法主要采用单智能体框架，在蒙特卡洛树搜索（MCTS）规划过程中生成搜索分支并估计奖励。这种单智能体范式本质上限制了探索能力，通常导致生成的分支多样性不足以及规划性能欠佳。为克服这些限制，我们提出了基于异构语言模型组合的协同多智能体规划（SYMPHONY），这是一个新颖的多智能体规划框架，它整合了一组基于异构语言模型的智能体。通过利用不同智能体间多样化的推理模式，SYMPHONY增强了模拟推演的多样性，并促进了更有效的探索。在多个基准任务上的实证结果表明，即使使用可在消费级硬件上部署的开源LLM进行实例化，SYMPHONY也能实现强劲的性能。当通过API接入基于云的LLM进行增强时，SYMPHONY展现出进一步的性能提升，超越了现有的先进基线方法，并凸显了异构多智能体协调在规划任务中的有效性。

0

相关内容

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

专知会员服务

29+阅读 · 2月27日

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

专知会员服务

17+阅读 · 1月14日

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

专知会员服务

33+阅读 · 2025年9月27日

PlanGenLLMs：大型语言模型规划能力的最新综述

PlanGenLLMs：大型语言模型规划能力的最新综述

专知会员服务

34+阅读 · 2025年5月18日

基于大语言模型的智能体优化研究综述

基于大语言模型的智能体优化研究综述

专知会员服务

65+阅读 · 2025年3月25日

多智能体协作机制：大语言模型综述

多智能体协作机制：大语言模型综述

专知会员服务

71+阅读 · 2025年3月4日

设计和构建强大的大语言模型智能体

设计和构建强大的大语言模型智能体

专知会员服务

55+阅读 · 2024年10月6日

基于大型语言模型的多智能体：进展与挑战综述

基于大型语言模型的多智能体：进展与挑战综述

专知会员服务

140+阅读 · 2024年2月6日

【普林斯顿】基于大型语言模型的语言智能体认知架构

【普林斯顿】基于大型语言模型的语言智能体认知架构

专知会员服务

77+阅读 · 2023年9月6日

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

专知会员服务

161+阅读 · 2023年8月23日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

26+阅读 · 2023年4月4日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

16+阅读 · 2020年9月9日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

AI前线

15+阅读 · 2019年3月21日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

专知

21+阅读 · 2018年11月20日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

复杂非完整多自主体网络协同算法设计与性能极限分析

国家自然科学基金

1+阅读 · 2015年12月31日

基于周期曲面的异构多孔功能结构跨尺度数字化特征建模

国家自然科学基金

0+阅读 · 2015年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

Arxiv

0+阅读 · 3月10日

MagicAgent: Towards Generalized Agent Planning

Arxiv

0+阅读 · 3月1日

Difficulty-Aware Agentic Orchestration for Query-Specific Multi-Agent Workflows

Arxiv

0+阅读 · 2月13日

IMAGINE: Integrating Multi-Agent System into One Model for Complex Reasoning and Planning

Arxiv

0+阅读 · 2月10日

DiLLS: Interactive Diagnosis of LLM-based Multi-agent Systems via Layered Summary of Agent Behaviors

Arxiv

0+阅读 · 2月5日

On the Uncertainty of Large Language Model-Based Multi-Agent Systems

Arxiv

0+阅读 · 2月4日

Cognitively Diverse Multiple-Choice Question Generation: A Hybrid Multi-Agent Framework with Large Language Models

Arxiv

0+阅读 · 2月3日

Symphony-Coord: Emergent Coordination in Decentralized Agent Systems

Arxiv

0+阅读 · 2月1日

MiTa: A Hierarchical Multi-Agent Collaboration Framework with Memory-integrated and Task Allocation

Arxiv

0+阅读 · 1月30日

ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

多智能体规划

最新内容

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

5+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

4+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

5+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

3+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

3+阅读 · 7月30日

综述 | Memory for Large Language Models：大模型记忆机制全景

综述 | Memory for Large Language Models：大模型记忆机制全景

专知会员服务

6+阅读 · 7月29日

博士论文 | Riemannian Deep Learning：模块、网络与几何

博士论文 | Riemannian Deep Learning：模块、网络与几何

专知会员服务

3+阅读 · 7月29日

《越野作战环境下路径规划的多准则整数规划模型》

《越野作战环境下路径规划的多准则整数规划模型》

专知会员服务

9+阅读 · 7月29日

人工智能大语言模型引擎如何重塑全球冲突信息环境最新50页

人工智能大语言模型引擎如何重塑全球冲突信息环境最新50页

专知会员服务

7+阅读 · 7月29日

《防空系统对自主武器系统辩论中“有意义的人类控制”的启示》70页报告

《防空系统对自主武器系统辩论中“有意义的人类控制”的启示》70页报告

专知会员服务

6+阅读 · 7月29日

“对标ChatGPT”：乌军研发Marichka AI系统用于战场筹划

“对标ChatGPT”：乌军研发Marichka AI系统用于战场筹划

专知会员服务

10+阅读 · 7月29日

《同步多无人机系统中的故障与通信》

《同步多无人机系统中的故障与通信》

专知会员服务

4+阅读 · 7月29日

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

专知会员服务

5+阅读 · 7月28日

博士论文 | 从算法到基础模型：强化学习的统一视角

博士论文 | 从算法到基础模型：强化学习的统一视角

专知会员服务

11+阅读 · 7月28日

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

7+阅读 · 7月28日

相关VIP内容

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

专知会员服务

29+阅读 · 2月27日

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

专知会员服务

17+阅读 · 1月14日

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

专知会员服务

33+阅读 · 2025年9月27日

PlanGenLLMs：大型语言模型规划能力的最新综述

PlanGenLLMs：大型语言模型规划能力的最新综述

专知会员服务

34+阅读 · 2025年5月18日

基于大语言模型的智能体优化研究综述

基于大语言模型的智能体优化研究综述

专知会员服务

65+阅读 · 2025年3月25日

多智能体协作机制：大语言模型综述

多智能体协作机制：大语言模型综述

专知会员服务

71+阅读 · 2025年3月4日

设计和构建强大的大语言模型智能体

设计和构建强大的大语言模型智能体

专知会员服务

55+阅读 · 2024年10月6日

基于大型语言模型的多智能体：进展与挑战综述

基于大型语言模型的多智能体：进展与挑战综述

专知会员服务

140+阅读 · 2024年2月6日

【普林斯顿】基于大型语言模型的语言智能体认知架构

【普林斯顿】基于大型语言模型的语言智能体认知架构

专知会员服务

77+阅读 · 2023年9月6日

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

专知会员服务

161+阅读 · 2023年8月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《下一代无线网络中的多无人机通信资源管理》

《人机协同在安全关键型操作决策中的应用》120页

“史诗怒火”行动：现代多域作战的重要节点

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

26+阅读 · 2023年4月4日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

16+阅读 · 2020年9月9日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

AI前线

15+阅读 · 2019年3月21日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

西湖大学张岳：自然语言处理中的多任务联合学习（384页PPT）

专知

21+阅读 · 2018年11月20日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

Arxiv

0+阅读 · 3月10日

MagicAgent: Towards Generalized Agent Planning

Arxiv

0+阅读 · 3月1日

Difficulty-Aware Agentic Orchestration for Query-Specific Multi-Agent Workflows

Arxiv

0+阅读 · 2月13日

IMAGINE: Integrating Multi-Agent System into One Model for Complex Reasoning and Planning

Arxiv

0+阅读 · 2月10日

DiLLS: Interactive Diagnosis of LLM-based Multi-agent Systems via Layered Summary of Agent Behaviors

Arxiv

0+阅读 · 2月5日

On the Uncertainty of Large Language Model-Based Multi-Agent Systems

Arxiv

0+阅读 · 2月4日

Cognitively Diverse Multiple-Choice Question Generation: A Hybrid Multi-Agent Framework with Large Language Models

Arxiv

0+阅读 · 2月3日

Symphony-Coord: Emergent Coordination in Decentralized Agent Systems

Arxiv

0+阅读 · 2月1日

MiTa: A Hierarchical Multi-Agent Collaboration Framework with Memory-integrated and Task Allocation

Arxiv

0+阅读 · 1月30日

ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas

Arxiv

0+阅读 · 1月30日

相关基金

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

复杂非完整多自主体网络协同算法设计与性能极限分析

国家自然科学基金

1+阅读 · 2015年12月31日

基于周期曲面的异构多孔功能结构跨尺度数字化特征建模

国家自然科学基金

0+阅读 · 2015年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员