While Multi-Agent Systems (MAS) excel in complex reasoning, they suffer from the cascading impact of erroneous information generated by individual participants. Current solutions often resort to rigid structural engineering or expensive fine-tuning, limiting their deployability and adaptability. We propose AgentDropoutV2, a test-time rectify-or-reject pruning framework designed to dynamically optimize MAS information flow without retraining. Our approach acts as an active firewall, intercepting agent outputs and employing a retrieval-augmented rectifier to iteratively correct errors based on a failure-driven indicator pool. This mechanism allows for the precise identification of potential errors using distilled failure patterns as prior knowledge. Irreparable outputs are subsequently pruned to prevent error propagation, while a fallback strategy preserves system integrity. Empirical results on extensive math benchmarks show that AgentDropoutV2 significantly boosts the MAS's task performance, achieving an average accuracy gain of 6.3 percentage points on math benchmarks. Furthermore, the system exhibits robust generalization and adaptivity, dynamically modulating rectification efforts based on task difficulty while leveraging context-aware indicators to resolve a wide spectrum of error patterns. Our code and dataset are released at https://github.com/TonySY2/AgentDropoutV2.


翻译:尽管多智能体系统(MAS)在复杂推理方面表现出色,但其易受单个参与者生成错误信息的级联影响。现有解决方案通常依赖于僵化的结构工程或昂贵的微调,限制了其可部署性与适应性。我们提出AgentDropoutV2,一种测试时修正-拒绝剪枝框架,旨在无需重新训练即可动态优化MAS信息流。该方法充当主动防火墙,拦截智能体输出并采用检索增强修正器,基于故障驱动指示器池迭代纠正错误。该机制允许利用提炼的故障模式作为先验知识,精确识别潜在错误。不可修复的输出随后被剪枝以防止错误传播,同时后备策略保障系统完整性。在广泛数学基准测试上的实证结果表明,AgentDropoutV2显著提升了MAS的任务性能,在数学基准上平均准确率提升6.3个百分点。此外,该系统展现出强大的泛化与自适应能力,能根据任务难度动态调节修正强度,并利用上下文感知指示器解决广泛类型的错误模式。我们的代码与数据集发布于https://github.com/TonySY2/AgentDropoutV2。

0
下载
关闭预览

相关内容

智能体工程(Agent Engineering)
专知会员服务
33+阅读 · 2025年12月31日
AgentOps综述:分类、挑战与未来方向
专知会员服务
38+阅读 · 2025年8月6日
Agent AI:多模态交互的新地平线
专知会员服务
21+阅读 · 2025年5月26日
《不确定通信条件下的分布式多智能体决策》122页
专知会员服务
57+阅读 · 2025年2月26日
《信息在多智能体决策中的作用》214页
专知会员服务
63+阅读 · 2024年11月20日
AI Agent:基于大模型的自主智能体
专知会员服务
249+阅读 · 2023年9月9日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
15+阅读 · 2020年9月9日
多智能体强化学习(MARL)近年研究概览
PaperWeekly
38+阅读 · 2020年3月15日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
《作战研究是实现战场人工智能潜力的关键》
专知会员服务
14+阅读 · 今天6:08
《军事训练与行动期间新鲜膳食营养保障》380页
专知会员服务
2+阅读 · 今天5:40
伊朗战争时间线:关键节点与袭击事件
专知会员服务
6+阅读 · 今天5:34
《面向海军应用的无人机网络安全仿真环境》
专知会员服务
12+阅读 · 4月7日
无人机与僵局:俄乌战争难以突破
专知会员服务
5+阅读 · 4月7日
相关VIP内容
智能体工程(Agent Engineering)
专知会员服务
33+阅读 · 2025年12月31日
AgentOps综述:分类、挑战与未来方向
专知会员服务
38+阅读 · 2025年8月6日
Agent AI:多模态交互的新地平线
专知会员服务
21+阅读 · 2025年5月26日
《不确定通信条件下的分布式多智能体决策》122页
专知会员服务
57+阅读 · 2025年2月26日
《信息在多智能体决策中的作用》214页
专知会员服务
63+阅读 · 2024年11月20日
AI Agent:基于大模型的自主智能体
专知会员服务
249+阅读 · 2023年9月9日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员