As language models are deployed as autonomous agents that negotiate, cooperate, and compete on behalf of human principals, their strategic dispositions acquire direct economic consequences. Here we show, across 51,906 game-theoretic trials generating 826,990 strategic decisions from 25 large language models spanning seven developers and 38 canonical games, that models converge on competitive and coordination behaviour (coefficient of variation 0.06 for coordination, 0.11 for strategic depth) while diverging 48-fold on cooperation, from 1.5 per cent (GPT-5 Nano) to 71.5 per cent (Claude Opus 4.6). Provider identity is the dominant predictor of cooperative disposition, and this divergence is generationally unstable: OpenAI cooperation fell from 50.3 to 1.5 per cent across four model generations while Google cooperation rose from 8.3 to 56.8 per cent. Endgame analysis reveals that Anthropic frontier models sustain 57 per cent cooperation in the final round of finitely repeated games, where backward induction predicts zero, while the newest Google models cooperate throughout but universally defect when punishment becomes impossible. These strategic personalities are shaped by training pipelines, shift unpredictably across model versions, and cannot be inferred from capability benchmarks, yet they determine the cooperative outcomes of every economic interaction these models mediate. The complete dataset and an interactive explorer for the data are publicly available at https://felipemaffonso.github.io/strategic-personalities/.


翻译:随着语言模型作为自主智能体被部署,代表人类主体进行谈判、合作与竞争,其战略倾向便获得了直接的经济后果。在此,我们通过涵盖7家开发商的25个大语言模型在38个经典博弈中进行的51,906轮博弈实验,生成826,990个战略决策,表明模型在竞争与协调行为上趋于收敛(协调行为变异系数为0.06,战略深度为0.11),而在合作行为上存在48倍的差异,从1.5%(GPT-5 Nano)到71.5%(Claude Opus 4.6)不等。开发者身份是合作倾向的主要预测因子,且这种分歧在模型世代间不稳定:OpenAI模型在四代版本中合作率从50.3%降至1.5%,而Google模型则从8.3%升至56.8%。终局分析显示,Anthropic前沿模型在有限重复博弈的最后一轮中维持57%的合作率——此时后向归纳预测合作率为零——而最新的Google模型全程合作,但当惩罚不再可能时普遍背叛。这些战略特征由训练管线塑造,随模型版本不可预测地变化,且无法从能力基准中推断,但它们决定了这些模型中介的每一项经济互动的合作结果。完整数据集及交互式探索工具已在https://felipemaffonso.github.io/strategic-personalities/ 公开提供。

0
下载
关闭预览

相关内容

大型语言模型的规模效应局限
专知会员服务
14+阅读 · 2025年11月18日
大语言模型与小语言模型协同机制综述
专知会员服务
40+阅读 · 2025年5月15日
博弈论与大语言模型的结合:系统性综述
专知会员服务
60+阅读 · 2025年2月14日
大语言模型在规划与调度问题上的应用
专知会员服务
53+阅读 · 2025年1月12日
大语言模型的因果性
专知会员服务
40+阅读 · 2024年10月22日
大语言模型对汽车行业的影响和实践探索
专知会员服务
25+阅读 · 2024年4月27日
大型语言模型:原理、实现与发展
专知会员服务
102+阅读 · 2023年11月28日
大型语言模型公平性
专知会员服务
41+阅读 · 2023年8月31日
大模型时代的自然语言处理:挑战、机遇与发展
专知会员服务
130+阅读 · 2023年6月17日
【深度语义匹配模型】原理篇二:交互篇
AINLP
16+阅读 · 2020年5月18日
绝对干货!NLP预训练模型:从transformer到albert
新智元
13+阅读 · 2019年11月10日
中文对比英文自然语言处理NLP的区别综述
AINLP
18+阅读 · 2019年3月20日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Arxiv
0+阅读 · 3月22日
VIP会员
最新内容
无人机自主控制与人工智能:系统性综述
专知会员服务
10+阅读 · 今天7:25
巡飞弹与反无人机系统——现代战场的两大支柱
专知会员服务
3+阅读 · 今天6:54
《打造“黄金舰队”》57页报告
专知会员服务
3+阅读 · 今天6:52
《北约数字教官网络发展路径》128页报告
专知会员服务
2+阅读 · 今天6:33
ECCV 2026 | MIMFlow:MIM与归一化流统一图像生成
专知会员服务
7+阅读 · 6月25日
网状网络及其在军事领域的运用
专知会员服务
8+阅读 · 6月25日
无美国参与的欧洲战争方式(万字长文)
专知会员服务
8+阅读 · 6月25日
《国防领域敏感性分析白皮书》
专知会员服务
9+阅读 · 6月25日
综述 | 从问答到任务完成:Agent系统与Harness设计
专知会员服务
10+阅读 · 6月24日
Agentic RL:框架、实践与长程智能体训练
专知会员服务
10+阅读 · 6月24日
相关VIP内容
大型语言模型的规模效应局限
专知会员服务
14+阅读 · 2025年11月18日
大语言模型与小语言模型协同机制综述
专知会员服务
40+阅读 · 2025年5月15日
博弈论与大语言模型的结合:系统性综述
专知会员服务
60+阅读 · 2025年2月14日
大语言模型在规划与调度问题上的应用
专知会员服务
53+阅读 · 2025年1月12日
大语言模型的因果性
专知会员服务
40+阅读 · 2024年10月22日
大语言模型对汽车行业的影响和实践探索
专知会员服务
25+阅读 · 2024年4月27日
大型语言模型:原理、实现与发展
专知会员服务
102+阅读 · 2023年11月28日
大型语言模型公平性
专知会员服务
41+阅读 · 2023年8月31日
大模型时代的自然语言处理:挑战、机遇与发展
专知会员服务
130+阅读 · 2023年6月17日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员