Do We Always Need Query-Level Workflows? Rethinking Agentic Workflow Generation for Multi-Agent Systems - 专知论文

会员服务 ·

0

系统 · 智能体系统 · 多智能体系统 · 令牌 · 缩放 ·

Do We Always Need Query-Level Workflows? Rethinking Agentic Workflow Generation for Multi-Agent Systems

翻译：我们总是需要查询级工作流吗？反思多智能体系统中的智能工作流生成

Zixu Wang,Bingbing Xu,Yige Yuan,Huawei Shen,Xueqi Cheng

from arxiv, 17 pages, 4 figures, 3 tables

Multi-Agent Systems (MAS) built on large language models typically solve complex tasks by coordinating multiple agents through workflows. Existing approaches generates workflows either at task level or query level, but their relative costs and benefits remain unclear. After rethinking and empirical analyses, we show that query-level workflow generation is not always necessary, since a small set of top-K best task-level workflows together already covers equivalent or even more queries. We further find that exhaustive execution-based task-level evaluation is both extremely token-costly and frequently unreliable. Inspired by the idea of self-evolution and generative reward modeling, we propose a low-cost task-level generation framework \textbf{SCALE}, which means \underline{\textbf{S}}elf prediction of the optimizer with few shot \underline{\textbf{CAL}}ibration for \underline{\textbf{E}}valuation instead of full validation execution. Extensive experiments demonstrate that \textbf{SCALE} maintains competitive performance, with an average degradation of just 0.61\% compared to existing approach across multiple datasets, while cutting overall token usage by up to 83\%.

翻译：基于大语言模型构建的多智能体系统通常通过协调多个智能体的工作流来解决复杂任务。现有方法在任务级别或查询级别生成工作流，但其相对成本与收益尚不明确。经过理论反思与实证分析，我们发现查询级工作流生成并非总是必要，因为一组数量有限的Top-K最优任务级工作流集合已能覆盖同等甚至更多的查询。我们进一步发现，基于穷举执行的任务级评估不仅令牌成本极高，且经常不可靠。受自演进思想和生成式奖励建模的启发，我们提出一种低成本任务级生成框架 **SCALE**，其核心在于通过少量示例校准的优化器自我预测进行\underline{\textbf{评}}估，而非完整的验证执行。大量实验表明，**SCALE** 在保持竞争力的同时，在多个数据集上相较于现有方法平均性能仅下降0.61%，而总体令牌使用量最高可降低83%。

0

相关内容

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

40+阅读 · 2月2日

【ICML2025】MetaAgent：基于有限状态机的多智能体系统自动构建方法

【ICML2025】MetaAgent：基于有限状态机的多智能体系统自动构建方法

专知会员服务

15+阅读 · 2025年7月31日

【博士论文】优化智能体工作流以提升信息获取效率

【博士论文】优化智能体工作流以提升信息获取效率

专知会员服务

19+阅读 · 2025年7月7日

【EPFL博士论文】大型语言模型时代的协作式智能体

【EPFL博士论文】大型语言模型时代的协作式智能体

专知会员服务

35+阅读 · 2025年5月16日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

26+阅读 · 2025年5月7日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

46+阅读 · 2025年5月6日

面向关系建模的合作多智能体深度强化学习综述

面向关系建模的合作多智能体深度强化学习综述

专知会员服务

41+阅读 · 2025年4月18日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

60+阅读 · 2025年4月6日

具身人工智能中的生成式多智能体协作：系统性综述

具身人工智能中的生成式多智能体协作：系统性综述

专知会员服务

54+阅读 · 2025年2月22日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知会员服务

146+阅读 · 2022年11月14日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

NLP不同任务Tensorflow深度学习模型大全

NLP不同任务Tensorflow深度学习模型大全

专知

10+阅读 · 2019年3月19日

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

AI研习社

16+阅读 · 2018年12月4日

DeepMind：用PopArt进行多任务深度强化学习

DeepMind：用PopArt进行多任务深度强化学习

论智

30+阅读 · 2018年9月14日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

专知

28+阅读 · 2017年12月6日

tensorflow系列笔记：流程，概念和代码解析

tensorflow系列笔记：流程，概念和代码解析

北京思腾合力科技有限公司

30+阅读 · 2017年11月11日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向网络社会的工作流关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

AgentConductor: Topology Evolution for Multi-Agent Competition-Level Code Generation

Arxiv

0+阅读 · 2月19日

FlowSteer: Interactive Agentic Workflow Orchestration via End-to-End Reinforcement Learning

Arxiv

0+阅读 · 2月17日

Difficulty-Aware Agentic Orchestration for Query-Specific Multi-Agent Workflows

Arxiv

0+阅读 · 2月13日

FlowMind: Execute-Summarize for Structured Workflow Generation from LLM Reasoning

Arxiv

0+阅读 · 2月12日

Learning to Compose for Cross-domain Agentic Workflow Generation

Arxiv

0+阅读 · 2月11日

AgentXRay: White-Boxing Agentic Systems via Workflow Reconstruction

Arxiv

0+阅读 · 2月6日

Constrained Process Maps for Multi-Agent Generative AI Workflows

Arxiv

0+阅读 · 2月2日

Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies

Arxiv

0+阅读 · 1月31日

AgentAsk: Multi-Agent Systems Need to Ask

Arxiv

0+阅读 · 1月19日

Batch Query Processing and Optimization for Agentic Workflows

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

智能体系统

多智能体系统

最新内容

审视现代战争中的 AI 赋能杀伤链系统及印度防务的战略要务（中文版）

审视现代战争中的 AI 赋能杀伤链系统及印度防务的战略要务（中文版）

专知会员服务

1+阅读 · 37分钟前

分布式作战效能：乌克兰如何在战术层面重新定义火力打击、电子战与防空（中文版）

分布式作战效能：乌克兰如何在战术层面重新定义火力打击、电子战与防空（中文版）

专知会员服务

1+阅读 · 45分钟前

马赛克防御与分布式指挥：伊朗的回击（中文版）

马赛克防御与分布式指挥：伊朗的回击（中文版）

专知会员服务

3+阅读 · 52分钟前

《基于理论的威慑效能评估》

《基于理论的威慑效能评估》

专知会员服务

2+阅读 · 54分钟前

《移动旅级战斗队转型中的支援单元指挥控制挑战》

《移动旅级战斗队转型中的支援单元指挥控制挑战》

专知会员服务

13+阅读 · 5月27日

ICML2026 | 重新思考顺序知识编辑中的正则化

ICML2026 | 重新思考顺序知识编辑中的正则化

专知会员服务

7+阅读 · 5月27日

《用于兵力发展选项优先排序的成本效益模型》

《用于兵力发展选项优先排序的成本效益模型》

专知会员服务

11+阅读 · 5月27日

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

专知会员服务

10+阅读 · 5月27日

美军战场新倡议——国防自主作战群（DAWG）：五角大楼的540亿美元自主作战豪赌

美军战场新倡议——国防自主作战群（DAWG）：五角大楼的540亿美元自主作战豪赌

专知会员服务

8+阅读 · 5月27日

ICML2026 | LAVL：离线目标条件强化学习中的潜在表示对齐

ICML2026 | LAVL：离线目标条件强化学习中的潜在表示对齐

专知会员服务

7+阅读 · 5月26日

AutoResearch AI综述：迈向AI驱动的科学发现自动化

AutoResearch AI综述：迈向AI驱动的科学发现自动化

专知会员服务

10+阅读 · 5月26日

《Palantir边缘人工智能》手册

《Palantir边缘人工智能》手册

专知会员服务

25+阅读 · 5月26日

人工智能与现代战争：2026年美以对伊打击如何重构杀伤链

人工智能与现代战争：2026年美以对伊打击如何重构杀伤链

专知会员服务

16+阅读 · 5月26日

《运用人工智能及其他经验：瑞典制定2045年后战役级多域作战探索性概念的实践》

《运用人工智能及其他经验：瑞典制定2045年后战役级多域作战探索性概念的实践》

专知会员服务

13+阅读 · 5月26日

多层次反无人机战略：改革政策、提升公众意识并纳入防空体系（万字长文）

多层次反无人机战略：改革政策、提升公众意识并纳入防空体系（万字长文）

专知会员服务

13+阅读 · 5月26日

相关VIP内容

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

40+阅读 · 2月2日

【ICML2025】MetaAgent：基于有限状态机的多智能体系统自动构建方法

【ICML2025】MetaAgent：基于有限状态机的多智能体系统自动构建方法

专知会员服务

15+阅读 · 2025年7月31日

【博士论文】优化智能体工作流以提升信息获取效率

【博士论文】优化智能体工作流以提升信息获取效率

专知会员服务

19+阅读 · 2025年7月7日

【EPFL博士论文】大型语言模型时代的协作式智能体

【EPFL博士论文】大型语言模型时代的协作式智能体

专知会员服务

35+阅读 · 2025年5月16日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

26+阅读 · 2025年5月7日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

46+阅读 · 2025年5月6日

面向关系建模的合作多智能体深度强化学习综述

面向关系建模的合作多智能体深度强化学习综述

专知会员服务

41+阅读 · 2025年4月18日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

60+阅读 · 2025年4月6日

具身人工智能中的生成式多智能体协作：系统性综述

具身人工智能中的生成式多智能体协作：系统性综述

专知会员服务

54+阅读 · 2025年2月22日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知会员服务

146+阅读 · 2022年11月14日

热门VIP内容

开通专知VIP会员享更多权益服务

分布式作战效能：乌克兰如何在战术层面重新定义火力打击、电子战与防空（中文版）

《基于理论的威慑效能评估》

审视现代战争中的 AI 赋能杀伤链系统及印度防务的战略要务（中文版）

马赛克防御与分布式指挥：伊朗的回击（中文版）

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

专访俞栋：多模态是迈向通用人工智能的重要方向

专访俞栋：多模态是迈向通用人工智能的重要方向

AI科技评论

26+阅读 · 2019年9月9日

NLP不同任务Tensorflow深度学习模型大全

NLP不同任务Tensorflow深度学习模型大全

专知

10+阅读 · 2019年3月19日

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

AI研习社

16+阅读 · 2018年12月4日

DeepMind：用PopArt进行多任务深度强化学习

DeepMind：用PopArt进行多任务深度强化学习

论智

30+阅读 · 2018年9月14日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

【下载】最新TensorFlow深度学习教程指引《Learning TensorFlow，构建深度学习系统指引》

专知

28+阅读 · 2017年12月6日

tensorflow系列笔记：流程，概念和代码解析

tensorflow系列笔记：流程，概念和代码解析

北京思腾合力科技有限公司

30+阅读 · 2017年11月11日

相关论文

AgentConductor: Topology Evolution for Multi-Agent Competition-Level Code Generation

Arxiv

0+阅读 · 2月19日

FlowSteer: Interactive Agentic Workflow Orchestration via End-to-End Reinforcement Learning

Arxiv

0+阅读 · 2月17日

Difficulty-Aware Agentic Orchestration for Query-Specific Multi-Agent Workflows

Arxiv

0+阅读 · 2月13日

FlowMind: Execute-Summarize for Structured Workflow Generation from LLM Reasoning

Arxiv

0+阅读 · 2月12日

Learning to Compose for Cross-domain Agentic Workflow Generation

Arxiv

0+阅读 · 2月11日

AgentXRay: White-Boxing Agentic Systems via Workflow Reconstruction

Arxiv

0+阅读 · 2月6日

Constrained Process Maps for Multi-Agent Generative AI Workflows

Arxiv

0+阅读 · 2月2日

Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies

Arxiv

0+阅读 · 1月31日

AgentAsk: Multi-Agent Systems Need to Ask

Arxiv

0+阅读 · 1月19日

Batch Query Processing and Optimization for Agentic Workflows

Arxiv

0+阅读 · 1月19日

相关基金

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向网络社会的工作流关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

49+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员