While Multi-Agent Systems (MAS) excel in complex reasoning, they suffer from the cascading impact of erroneous information from individual agents. Current solutions often resort to rigid structural engineering or expensive fine-tuning, limiting their adaptability. We propose AgentDropoutV2 (ADv2), a test-time rectify-or-reject pruning framework that dynamically optimizes MAS information flow. Acting as an active firewall, ADv2 intercepts agent outputs and employs a retrieval-augmented rectifier to iteratively correct errors. This rectification is guided by an indicator pool, which is constructed offline by distilling error patterns from historical MAS failure trajectories. Irreparable outputs are subsequently pruned to prevent error propagation. Empirical results demonstrate that ADv2 significantly boosts performance on both fixed and dynamic MAS frameworks, achieving average accuracy gains of 6.39 and 2.28 percentage points on extensive math and code benchmarks, respectively. Furthermore, ADv2 exhibits remarkable adaptivity, dynamically modulating rectification efforts based on task difficulty to resolve a wide spectrum of error patterns. Our code is released at https://github.com/TonySY2/AgentDropoutV2.


翻译:尽管多智能体系统(MAS)在复杂推理任务中表现卓越,但个体智能体错误信息的级联效应始终困扰着系统性能。现有解决方案多采用僵化的结构工程或高成本的微调方法,限制了其适应性。我们提出AgentDropoutV2(ADv2)——一种测试时修正或剪枝框架,可动态优化MAS信息流。作为主动防火墙,ADv2拦截智能体输出,并采用检索增强修正器迭代纠错。该校正过程由离线构建的指示池引导,该池通过从历史MAS故障轨迹中蒸馏错误模式生成。不可修复的输出将被剪除以防止错误传播。实验结果表明,ADv2在固定和动态MAS框架上均显著提升性能,在广泛数学与代码基准测试中分别实现6.39和2.28个百分点的平均准确率提升。此外,ADv2展现出卓越自适应性,能根据任务难度动态调节校正力度,解决多样错误模式。代码已开源至https://github.com/TonySY2/AgentDropoutV2。

0
下载
关闭预览

相关内容

AgentOps综述:智能体系统运维框架
专知会员服务
18+阅读 · 6月4日
智能体工程(Agent Engineering)
专知会员服务
36+阅读 · 2025年12月31日
AgentOps综述:分类、挑战与未来方向
专知会员服务
40+阅读 · 2025年8月6日
Agent AI:多模态交互的新地平线
专知会员服务
22+阅读 · 2025年5月26日
《信息在多智能体决策中的作用》214页
专知会员服务
64+阅读 · 2024年11月20日
多智能体强化学习(MARL)近年研究概览
PaperWeekly
38+阅读 · 2020年3月15日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
5+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
AgentOps综述:智能体系统运维框架
专知会员服务
18+阅读 · 6月4日
智能体工程(Agent Engineering)
专知会员服务
36+阅读 · 2025年12月31日
AgentOps综述:分类、挑战与未来方向
专知会员服务
40+阅读 · 2025年8月6日
Agent AI:多模态交互的新地平线
专知会员服务
22+阅读 · 2025年5月26日
《信息在多智能体决策中的作用》214页
专知会员服务
64+阅读 · 2024年11月20日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员