While Multi-Agent Systems (MAS) excel in complex reasoning, they suffer from the cascading impact of erroneous information generated by individual participants. Current solutions often resort to rigid structural engineering or expensive fine-tuning, limiting their deployability and adaptability. We propose AgentDropoutV2, a test-time rectify-or-reject pruning framework designed to dynamically optimize MAS information flow without retraining. Our approach acts as an active firewall, intercepting agent outputs and employing a retrieval-augmented rectifier to iteratively correct errors based on a failure-driven indicator pool. This mechanism allows for the precise identification of potential errors using distilled failure patterns as prior knowledge. Irreparable outputs are subsequently pruned to prevent error propagation, while a fallback strategy preserves system integrity. Empirical results on extensive math benchmarks show that AgentDropoutV2 significantly boosts the MAS's task performance, achieving an average accuracy gain of 6.3 percentage points on math benchmarks. Furthermore, the system exhibits robust generalization and adaptivity, dynamically modulating rectification efforts based on task difficulty while leveraging context-aware indicators to resolve a wide spectrum of error patterns. Our code and dataset are released at https://github.com/TonySY2/AgentDropoutV2.


翻译:尽管多智能体系统(MAS)在复杂推理方面表现出色,但其易受单个参与者生成错误信息的级联影响。现有解决方案通常依赖于僵化的结构工程或昂贵的微调,限制了其可部署性与适应性。我们提出AgentDropoutV2,一种测试时修正-拒绝剪枝框架,旨在无需重新训练即可动态优化MAS信息流。该方法充当主动防火墙,拦截智能体输出并采用检索增强修正器,基于故障驱动指示器池迭代纠正错误。该机制允许利用提炼的故障模式作为先验知识,精确识别潜在错误。不可修复的输出随后被剪枝以防止错误传播,同时后备策略保障系统完整性。在广泛数学基准测试上的实证结果表明,AgentDropoutV2显著提升了MAS的任务性能,在数学基准上平均准确率提升6.3个百分点。此外,该系统展现出强大的泛化与自适应能力,能根据任务难度动态调节修正强度,并利用上下文感知指示器解决广泛类型的错误模式。我们的代码与数据集发布于https://github.com/TonySY2/AgentDropoutV2。

0
下载
关闭预览

相关内容

智能体工程(Agent Engineering)
专知会员服务
34+阅读 · 2025年12月31日
AgentOps综述:分类、挑战与未来方向
专知会员服务
38+阅读 · 2025年8月6日
Agent AI:多模态交互的新地平线
专知会员服务
21+阅读 · 2025年5月26日
《不确定通信条件下的分布式多智能体决策》122页
专知会员服务
57+阅读 · 2025年2月26日
《信息在多智能体决策中的作用》214页
专知会员服务
63+阅读 · 2024年11月20日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
16+阅读 · 2020年9月9日
多智能体强化学习(MARL)近年研究概览
PaperWeekly
38+阅读 · 2020年3月15日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Arxiv
14+阅读 · 2023年8月7日
VIP会员
最新内容
Claw AI Lab:从自动写论文到交互式AI研究实验室
专知会员服务
2+阅读 · 5月24日
美以伊冲突中的无人机反防空作战
专知会员服务
7+阅读 · 5月23日
安杜里尔与Meta研发军用智能眼镜的内幕
专知会员服务
7+阅读 · 5月22日
超越步调威胁:整合人工智能以加速指挥决策
专知会员服务
13+阅读 · 5月22日
Nature三连发AI自主科学发现论文
专知会员服务
9+阅读 · 5月21日
安杜里尔与人工智能驱动防务的崛起
专知会员服务
16+阅读 · 5月21日
相关VIP内容
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员