Multi-agent systems built on large language models are increasingly deployed in strategic policy and governance settings, where agents representing stakeholders with conflicting interests must coordinate under shared constraints. These systems typically assign role-based personas to agents, describing their motivations and objectives. Whether agents with role-based identities follow explicit payoffs or their assigned roles in strategic decision-making remains untested. Here we show that assigning role-based personas suppresses payoff-aligned behavior in four-agent strategic games, shifting equilibrium attainment by up to 90 percentage points even when agents have complete payoff information. We test a 2x2 factorial design (persona presence x payoff visibility) across four models (Qwen-7B, Qwen-32B, Llama-8B, Mistral-7B), and 53 environmental policy scenarios with two equilibria: Tragedy of the Commons, where individual payoff dominates, and Green Transition, where collective payoff dominates. With personas present, all models reach near-zero Tragedy equilibrium in the Tragedy-dominant scenarios despite complete payoff information, and 100% of equilibria correspond to Green Transition. No model reaches Tragedy equilibrium by removing personas alone; only Qwen models reach 65-90% Tragedy equilibrium rates when personas are removed, and payoffs are made explicit. Three distinct behavioral profiles emerge: Qwen shifts equilibrium selection based on framing condition, Mistral increases response variance without reaching the Tragedy equilibrium, and Llama holds near-constant across all conditions. Representational choices in multi-agent LLM systems are governance decisions: persona assignment determines which equilibrium a simulation produces, independent of the underlying incentive structure.


翻译:基于大语言模型构建的多智能体系统正日益应用于战略决策与治理场景,在此类场景中,代表不同利益冲突方的智能体需在共享约束下进行协调。这些系统通常为智能体分配基于角色的身份来刻画其动机与目标。基于角色身份的智能体在战略决策中究竟遵循显性收益还是其分配角色,这一问题尚未得到验证。本文证明,在四人博弈中,分配基于角色的身份会抑制遵循收益的行为,即使智能体掌握完全收益信息,均衡达成率仍可偏移高达90个百分点。我们在四个模型(Qwen-7B、Qwen-32B、Llama-8B、Mistral-7B)及53种环境政策场景(包含两种均衡:个体收益主导的"公地悲剧"均衡与集体收益主导的"绿色转型"均衡)中测试了2×2析因设计(身份存在性×收益可见性)。在存在身份的情况下,尽管具有完全收益信息,所有模型在公地悲剧主导场景中均达到接近零的公地悲剧均衡,且100%的均衡对应绿色转型。仅移除身份并不能使任何模型达到公地悲剧均衡;仅在移除身份且收益显性化后,Qwen模型才达到65-90%的公地悲剧均衡率。研究发现三种不同的行为特征:Qwen根据框架条件转变均衡选择,Mistral在未达到公地悲剧均衡的情况下增加响应方差,而Llama在所有条件下保持近恒定行为。多智能体大语言模型系统中的表征选择本质上是治理决策:身份分配决定了仿真产生的均衡类型,且独立于底层激励结构。

0
下载
关闭预览

相关内容

《多智能体大语言模型系统的可靠决策研究》
专知会员服务
41+阅读 · 2月2日
大模型赋能的具身智能:决策与具身学习综述
专知会员服务
48+阅读 · 2025年8月16日
大模型驱动的智能辅助决策原理与典型应用
专知会员服务
72+阅读 · 2025年1月7日
多智能体协同决策方法研究
专知会员服务
134+阅读 · 2022年12月15日
数据驱动的态势认知技术及发展思考
专知
19+阅读 · 2022年7月12日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
44+阅读 · 2019年10月16日
专访俞栋:多模态是迈向通用人工智能的重要方向
AI科技评论
27+阅读 · 2019年9月9日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
30+阅读 · 2019年7月7日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
【智能制造】智能制造的核心——智能决策
产业智能官
12+阅读 · 2018年4月11日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关资讯
数据驱动的态势认知技术及发展思考
专知
19+阅读 · 2022年7月12日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
44+阅读 · 2019年10月16日
专访俞栋:多模态是迈向通用人工智能的重要方向
AI科技评论
27+阅读 · 2019年9月9日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
30+阅读 · 2019年7月7日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
【智能制造】智能制造的核心——智能决策
产业智能官
12+阅读 · 2018年4月11日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员