Learning to Share: Selective Memory for Efficient Parallel Agentic Systems - 专知论文

会员服务 ·

0

并行 · 系统 · 并行智能 · 智能体系统 · 智能体 ·

Learning to Share: Selective Memory for Efficient Parallel Agentic Systems

翻译：学会共享：面向高效并行智能体系统的选择性记忆机制

Joseph Fioresi,Parth Parag Kulkarni,Ashmal Vayani,Song Wang,Mubarak Shah

Agentic systems solve complex tasks by coordinating multiple agents that iteratively reason, invoke tools, and exchange intermediate results. To improve robustness and solution quality, recent approaches deploy multiple agent teams running in parallel to explore diverse reasoning trajectories. However, parallel execution comes at a significant computational cost: when different teams independently reason about similar sub-problems or execute analogous steps, they repeatedly perform substantial overlapping computation. To address these limitations, in this paper, we propose Learning to Share (LTS), a learned shared-memory mechanism for parallel agentic frameworks that enables selective cross-team information reuse while controlling context growth. LTS introduces a global memory bank accessible to all teams and a lightweight controller that decides whether intermediate agent steps should be added to memory or not. The controller is trained using stepwise reinforcement learning with usage-aware credit assignment, allowing it to identify information that is globally useful across parallel executions. Experiments on the AssistantBench and GAIA benchmarks show that LTS significantly reduces overall runtime while matching or improving task performance compared to memory-free parallel baselines, demonstrating that learned memory admission is an effective strategy for improving the efficiency of parallel agentic systems. Project page: https://joefioresi718.github.io/LTS_webpage/

翻译：智能体系统通过协调多个智能体进行迭代推理、调用工具并交换中间结果来解决复杂任务。为提高系统鲁棒性与解决方案质量，近期研究部署了并行运行的多个智能体团队以探索多样化的推理轨迹。然而，并行执行会带来显著的计算成本：当不同团队独立处理相似子问题或执行类似步骤时，它们会重复执行大量重叠计算。为克服这些限制，本文提出"学会共享"（LTS）——一种用于并行智能体框架的习得式共享内存机制，该机制能在控制上下文增长的同时实现跨团队信息的选择性复用。LTS引入可供所有团队访问的全局记忆库，以及一个轻量级控制器用于决策是否将智能体中间步骤存入记忆。该控制器通过采用使用感知信用分配的逐步强化学习进行训练，使其能够识别在并行执行中具有全局价值的信息。在AssistantBench和GAIA基准测试上的实验表明，相较于无记忆并行基线方法，LTS在保持或提升任务性能的同时显著降低了总体运行时间，这证明习得式记忆准入是提升并行智能体系统效率的有效策略。项目页面：https://joefioresi718.github.io/LTS_webpage/

0

相关内容

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

41+阅读 · 2月2日

AI 智能体系统：体系架构、应用场景及评估范式

AI 智能体系统：体系架构、应用场景及评估范式

专知会员服务

70+阅读 · 1月6日

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

专知会员服务

44+阅读 · 2025年12月26日

《实现协同自主：从人机协作到多智能体系统》最新190页

《实现协同自主：从人机协作到多智能体系统》最新190页

专知会员服务

77+阅读 · 2025年8月1日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

48+阅读 · 2025年5月6日

面向关系建模的合作多智能体深度强化学习综述

面向关系建模的合作多智能体深度强化学习综述

专知会员服务

42+阅读 · 2025年4月18日

《针对高性能协作跟踪和编队目标的分布式迭代学习控制》169页论文

《针对高性能协作跟踪和编队目标的分布式迭代学习控制》169页论文

专知会员服务

29+阅读 · 2024年3月23日

智能集群系统的强化学习方法综述

智能集群系统的强化学习方法综述

专知会员服务

85+阅读 · 2024年1月1日

《异构多智能体系统在联合武器中的应用》美国空军2022最新106页论文

《异构多智能体系统在联合武器中的应用》美国空军2022最新106页论文

专知会员服务

177+阅读 · 2022年11月15日

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

专知会员服务

119+阅读 · 2022年3月18日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

DeepMind：用PopArt进行多任务深度强化学习

DeepMind：用PopArt进行多任务深度强化学习

论智

30+阅读 · 2018年9月14日

一文读懂智能对话系统

一文读懂智能对话系统

数据派THU

16+阅读 · 2018年1月27日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

产业智能官

25+阅读 · 2017年12月6日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

47+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Justitia: Fair and Efficient Scheduling of Task-parallel LLM Agents with Selective Pampering

Arxiv

0+阅读 · 3月14日

XSkill: Continual Learning from Experience and Skills in Multimodal Agents

Arxiv

0+阅读 · 3月12日

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Arxiv

0+阅读 · 3月11日

D3MAS: Decompose, Deduce, and Distribute for Enhanced Knowledge Sharing in Multi-Agent Systems

Arxiv

0+阅读 · 2月26日

Anatomy of Agentic Memory: Taxonomy and Empirical Analysis of Evaluation and System Limitations

Arxiv

0+阅读 · 2月22日

Learning to Compose for Cross-domain Agentic Workflow Generation

Arxiv

0+阅读 · 2月11日

CARL: Focusing Agentic Reinforcement Learning on Critical Actions

Arxiv

0+阅读 · 2月5日

Active Asymmetric Multi-Agent Multimodal Learning under Uncertainty

Arxiv

0+阅读 · 2月4日

Towards AI as Colleagues: Multi-Agent System Improves Structured Ideation Processes

Arxiv

0+阅读 · 1月31日

Learning Reward Functions for Cooperative Resilience in Multi-Agent Systems

Arxiv

0+阅读 · 1月29日

VIP会员

文章信息

相关主题

智能体系统

最新内容

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

12+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

6+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

7+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

10+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

9+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

10+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

10+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

6+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

6+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

8+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

6+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

7+阅读 · 7月17日

相关VIP内容

《多智能体大语言模型系统的可靠决策研究》

《多智能体大语言模型系统的可靠决策研究》

专知会员服务

41+阅读 · 2月2日

AI 智能体系统：体系架构、应用场景及评估范式

AI 智能体系统：体系架构、应用场景及评估范式

专知会员服务

70+阅读 · 1月6日

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

专知会员服务

44+阅读 · 2025年12月26日

《实现协同自主：从人机协作到多智能体系统》最新190页

《实现协同自主：从人机协作到多智能体系统》最新190页

专知会员服务

77+阅读 · 2025年8月1日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

48+阅读 · 2025年5月6日

面向关系建模的合作多智能体深度强化学习综述

面向关系建模的合作多智能体深度强化学习综述

专知会员服务

42+阅读 · 2025年4月18日

《针对高性能协作跟踪和编队目标的分布式迭代学习控制》169页论文

《针对高性能协作跟踪和编队目标的分布式迭代学习控制》169页论文

专知会员服务

29+阅读 · 2024年3月23日

智能集群系统的强化学习方法综述

智能集群系统的强化学习方法综述

专知会员服务

85+阅读 · 2024年1月1日

《异构多智能体系统在联合武器中的应用》美国空军2022最新106页论文

《异构多智能体系统在联合武器中的应用》美国空军2022最新106页论文

专知会员服务

177+阅读 · 2022年11月15日

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

专知会员服务

119+阅读 · 2022年3月18日

热门VIP内容

开通专知VIP会员享更多权益服务

锻造未来士兵：外骨骼、基因工程与赛博格

《无人机蜂群通信技术研究》50页

深入Project Maven：为何人工智能在战场上依然失灵

《无人机系统（UAS）通信网状网络试验性部署》50页报告

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

DeepMind：用PopArt进行多任务深度强化学习

DeepMind：用PopArt进行多任务深度强化学习

论智

30+阅读 · 2018年9月14日

一文读懂智能对话系统

一文读懂智能对话系统

数据派THU

16+阅读 · 2018年1月27日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

【知识图谱】基于神经网络的实体识别和关系抽取联合学习

产业智能官

25+阅读 · 2017年12月6日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

Justitia: Fair and Efficient Scheduling of Task-parallel LLM Agents with Selective Pampering

Arxiv

0+阅读 · 3月14日

XSkill: Continual Learning from Experience and Skills in Multimodal Agents

Arxiv

0+阅读 · 3月12日

Trajectory-Informed Memory Generation for Self-Improving Agent Systems

Arxiv

0+阅读 · 3月11日

D3MAS: Decompose, Deduce, and Distribute for Enhanced Knowledge Sharing in Multi-Agent Systems

Arxiv

0+阅读 · 2月26日

Anatomy of Agentic Memory: Taxonomy and Empirical Analysis of Evaluation and System Limitations

Arxiv

0+阅读 · 2月22日

Learning to Compose for Cross-domain Agentic Workflow Generation

Arxiv

0+阅读 · 2月11日

CARL: Focusing Agentic Reinforcement Learning on Critical Actions

Arxiv

0+阅读 · 2月5日

Active Asymmetric Multi-Agent Multimodal Learning under Uncertainty

Arxiv

0+阅读 · 2月4日

Towards AI as Colleagues: Multi-Agent System Improves Structured Ideation Processes

Arxiv

0+阅读 · 1月31日

Learning Reward Functions for Cooperative Resilience in Multi-Agent Systems

Arxiv

0+阅读 · 1月29日

相关基金

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

47+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员