基于约束过程映射的多智能体生成式AI工作流 (Constrained Process Maps for Multi-Agent Generative AI Workflows) - 专知论文

会员服务 ·

0

智能体 · AI · 不确定 · 系统 · 多智能体 ·

Constrained Process Maps for Multi-Agent Generative AI Workflows

翻译：基于约束过程映射的多智能体生成式AI工作流

Ananya Joshi,Michael Rudow

Large language model (LLM)-based agents are increasingly used to perform complex, multi-step workflows in regulated settings such as compliance and due diligence. However, many agentic architectures rely primarily on prompt engineering of a single agent, making it difficult to observe or compare how models handle uncertainty and coordination across interconnected decision stages and with human oversight. We introduce a multi-agent system formalized as a finite-horizon Markov Decision Process (MDP) with a directed acyclic structure. Each agent corresponds to a specific role or decision stage (e.g., content, business, or legal review in a compliance workflow), with predefined transitions representing task escalation or completion. Epistemic uncertainty is quantified at the agent level using Monte Carlo estimation, while system-level uncertainty is captured by the MDP's termination in either an automated labeled state or a human-review state. We illustrate the approach through a case study in AI safety evaluation for self-harm detection, implemented as a multi-agent compliance system. Results demonstrate improvements over a single-agent baseline, including up to a 19\% increase in accuracy, up to an 85x reduction in required human review, and, in some configurations, reduced processing time.

翻译：基于大语言模型（LLM）的智能体日益被用于在合规与尽职调查等受监管场景中执行复杂的多步骤工作流。然而，许多智能体架构主要依赖于对单一智能体的提示工程，这使得观察或比较模型如何在相互关联的决策阶段以及人类监督下处理不确定性与协调变得困难。我们提出了一种形式化为具有有向无环结构的有限时域马尔可夫决策过程（MDP）的多智能体系统。每个智能体对应一个特定角色或决策阶段（例如合规工作流中的内容、业务或法律审查），并具有代表任务升级或完成的预定义转移。认知不确定性在智能体层面通过蒙特卡洛估计进行量化，而系统级不确定性则由MDP终止于自动标记状态或人工审核状态来捕捉。我们通过一个AI安全评估案例研究（实现为多智能体合规系统）来阐述该方法，该案例专注于自残检测。结果表明，相较于单智能体基线，该方法实现了多项改进，包括准确率最高提升19%，所需人工审核量最高减少85倍，并且在某些配置下处理时间也有所缩短。

0

相关内容

智能体

智能体，顾名思义，就是具有智能的实体，英文名是Agent。

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

专知会员服务

4+阅读 · 2月27日

智能体世界模型：面向智能体化强化学习的无限合成环境

智能体世界模型：面向智能体化强化学习的无限合成环境

专知会员服务

20+阅读 · 2月11日

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

专知会员服务

30+阅读 · 2025年12月28日

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

专知会员服务

31+阅读 · 2025年9月27日

【ICML2025】MetaAgent：基于有限状态机的多智能体系统自动构建方法

【ICML2025】MetaAgent：基于有限状态机的多智能体系统自动构建方法

专知会员服务

15+阅读 · 2025年7月31日

上交大推出首个AI智能体协议全面综述：从碎片化到互联互通的智能体网络

上交大推出首个AI智能体协议全面综述：从碎片化到互联互通的智能体网络

专知会员服务

25+阅读 · 2025年4月30日

基于大语言模型的智能体优化研究综述

基于大语言模型的智能体优化研究综述

专知会员服务

59+阅读 · 2025年3月25日

多智能体协作机制：大语言模型综述

多智能体协作机制：大语言模型综述

专知会员服务

67+阅读 · 2025年3月4日

基于大型语言模型的软件工程智能体综述

基于大型语言模型的软件工程智能体综述

专知会员服务

58+阅读 · 2024年9月6日

《大型多模态智能体》综述

《大型多模态智能体》综述

专知会员服务

106+阅读 · 2024年2月26日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

32+阅读 · 2022年11月12日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

15+阅读 · 2020年9月9日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

带有输入饱和的多智能体系统的包含控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Difficulty-Aware Agentic Orchestration for Query-Specific Multi-Agent Workflows

Arxiv

0+阅读 · 2月13日

FlowMind: Execute-Summarize for Structured Workflow Generation from LLM Reasoning

Arxiv

0+阅读 · 2月12日

MAPS: A Multilingual Benchmark for Agent Performance and Security

Arxiv

0+阅读 · 2月10日

MapCoder-Lite: Distilling Multi-Agent Coding into a Single Small LLM

Arxiv

0+阅读 · 2月4日

Internet of Agentic AI: Incentive-Compatible Distributed Teaming and Workflow

Arxiv

0+阅读 · 2月3日

Experience-Driven Multi-Agent Systems Are Training-free Context-aware Earth Observers

Arxiv

0+阅读 · 1月30日

Optimizing Agentic Workflows using Meta-tools

Arxiv

0+阅读 · 1月29日

ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas

Arxiv

0+阅读 · 1月29日

Multi-Agent Collaborative Filtering: Orchestrating Users and Items for Agentic Recommendations

Arxiv

0+阅读 · 1月26日

Batch Query Processing and Optimization for Agentic Workflows

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

相关VIP内容

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

专知会员服务

4+阅读 · 2月27日

智能体世界模型：面向智能体化强化学习的无限合成环境

智能体世界模型：面向智能体化强化学习的无限合成环境

专知会员服务

20+阅读 · 2月11日

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

专知会员服务

30+阅读 · 2025年12月28日

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

基于大语言模型的智能体易产生幻觉：分类体系、方法与未来方向综述

专知会员服务

31+阅读 · 2025年9月27日

【ICML2025】MetaAgent：基于有限状态机的多智能体系统自动构建方法

【ICML2025】MetaAgent：基于有限状态机的多智能体系统自动构建方法

专知会员服务

15+阅读 · 2025年7月31日

上交大推出首个AI智能体协议全面综述：从碎片化到互联互通的智能体网络

上交大推出首个AI智能体协议全面综述：从碎片化到互联互通的智能体网络

专知会员服务

25+阅读 · 2025年4月30日

基于大语言模型的智能体优化研究综述

基于大语言模型的智能体优化研究综述

专知会员服务

59+阅读 · 2025年3月25日

多智能体协作机制：大语言模型综述

多智能体协作机制：大语言模型综述

专知会员服务

67+阅读 · 2025年3月4日

基于大型语言模型的软件工程智能体综述

基于大型语言模型的软件工程智能体综述

专知会员服务

58+阅读 · 2024年9月6日

《大型多模态智能体》综述

《大型多模态智能体》综述

专知会员服务

106+阅读 · 2024年2月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

25+阅读 · 2023年4月4日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

32+阅读 · 2022年11月12日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

15+阅读 · 2020年9月9日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Difficulty-Aware Agentic Orchestration for Query-Specific Multi-Agent Workflows

Arxiv

0+阅读 · 2月13日

FlowMind: Execute-Summarize for Structured Workflow Generation from LLM Reasoning

Arxiv

0+阅读 · 2月12日

MAPS: A Multilingual Benchmark for Agent Performance and Security

Arxiv

0+阅读 · 2月10日

MapCoder-Lite: Distilling Multi-Agent Coding into a Single Small LLM

Arxiv

0+阅读 · 2月4日

Internet of Agentic AI: Incentive-Compatible Distributed Teaming and Workflow

Arxiv

0+阅读 · 2月3日

Experience-Driven Multi-Agent Systems Are Training-free Context-aware Earth Observers

Arxiv

0+阅读 · 1月30日

Optimizing Agentic Workflows using Meta-tools

Arxiv

0+阅读 · 1月29日

ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas

Arxiv

0+阅读 · 1月29日

Multi-Agent Collaborative Filtering: Orchestrating Users and Items for Agentic Recommendations

Arxiv

0+阅读 · 1月26日

Batch Query Processing and Optimization for Agentic Workflows

Arxiv

0+阅读 · 1月19日

相关基金

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

带有输入饱和的多智能体系统的包含控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员