Large language model (LLM) agents increasingly coordinate in multi-agent systems, yet we lack an understanding of where and why cooperation fails. Many real-world coordination problems are not social dilemmas: helping others -- sharing documentation, unblocking a teammate -- costs the helper almost nothing while producing substantial collective benefit. Whether LLM agents cooperate in this regime, where helping is free and they are explicitly instructed to do so, remains unknown. We build a turn-based multi-agent environment that strips away all strategic complexity, making cooperation costless and trivially optimal. Across eight widely used LLMs, capability does not predict cooperation: OpenAI o3 reaches only 17% of optimal collective performance while the weaker o3-mini reaches 50%, despite identical instructions to maximize group revenue. Using a causal decomposition that automates one side of agent communication, we separate cooperation failures from competence failures, and find that several capable models actively withhold information despite gaining nothing from withholding. Targeted interventions address each mode: explicit protocols roughly double the performance of competence-limited models, while small sharing incentives unlock cooperation-limited ones. Our results suggest that scaling intelligence alone will not solve coordination in multi-agent systems, and will require deliberate cooperative design, even when helping costs nothing.


翻译:大语言模型(LLM)智能体在多智能体系统中日益协同工作,但我们对协作失败的原因和地点仍缺乏理解。许多现实世界的协调问题并非社会困境:帮助他人(如共享文档、解除队友阻塞)几乎不消耗帮助者的成本,却能产生巨大的集体收益。LLM智能体是否会在此类助人成本为零且被明确指示协作的情景下进行合作,目前尚不清楚。我们构建了一个基于回合制的多智能体环境,该环境剥离了所有策略复杂性,使协作变得无成本且显然最优。在八种广泛使用的LLM中,能力无法预测协作行为:尽管收到相同的最大化团队收益指令,OpenAI o3仅达到最优集体绩效的17%,而较弱的o3-mini达到50%。通过一种可自动处理智能体通信一端的因果分解方法,我们将协作失败与能力失败分离开来,并发现多个有能力的模型在未获得任何收益的情况下,仍主动隐瞒信息。针对每种模式的有针对性的干预措施:显式协议使能力受限模型的性能大致翻倍,而小型共享激励则解锁了协作受限模型。我们的结果表明,仅提升智能水平无法解决多智能体系统中的协调问题,即便帮助成本为零,也需要精心设计的协作机制。

0
下载
关闭预览

相关内容

大型语言模型的规模效应局限
专知会员服务
14+阅读 · 2025年11月18日
【EPFL博士论文】大型语言模型时代的协作式智能体
专知会员服务
35+阅读 · 2025年5月16日
大语言模型与小语言模型协同机制综述
专知会员服务
40+阅读 · 2025年5月15日
多智能体协作机制:大语言模型综述
专知会员服务
70+阅读 · 2025年3月4日
基于大型语言模型的多智能体:进展与挑战综述
专知会员服务
140+阅读 · 2024年2月6日
自然语言处理NLP的坑到底有多大?
专知
46+阅读 · 2018年11月12日
放弃 RNN/LSTM 吧,因为真的不好用!望周知~
人工智能头条
19+阅读 · 2018年4月24日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员