A key challenge for the safety of advanced AI systems is the possibility that multiple simpler agents might inadvertently form a collective agent with capabilities and goals distinct from those of any individual. More generally, determining when a group of agents can be viewed as a unified collective agent is a foundational question in the study of interactions and incentives in both biological and artificial systems. We adopt a behavioral perspective in answering this question, ascribing collective agency to a group when viewing the group's joint actions as rational and goal-directed successfully predicts its behavior. We formalize this perspective on collective agency using causal games -- which are causal models of strategic, multi-agent interactions -- and causal abstraction -- which formalizes when a simple, high-level model faithfully captures a more complex, low-level model. We use this framework to solve a puzzle regarding multi-agent incentives in actor-critic models and to make quantitative assessments of the degree of collective agency exhibited by different voting mechanisms. Our framework aims to provide a foundation for theoretical and empirical work to understand, predict, and control emergent collective agents in multi-agent AI systems.


翻译:先进AI系统安全性的一个关键挑战在于,多个简单智能体可能无意中形成一个集体能动体,其能力和目标与任何个体都不同。更一般地说,判断一组智能体何时可被视为统一集体能动体,是研究生物与人工系统中交互与激励的基础性问题。我们采用行为主义视角回答这一问题:当将群体的联合行动视为理性且目标导向时,若其能成功预测行为,则赋予该群体集体能动性。我们利用因果博弈(一种战略多智能体交互的因果模型)和因果抽象(一种形式化描述简单高层模型如何忠实捕捉复杂低层模型的方法)来形式化这一集体能动性视角。通过该框架,我们解决了演员-评论家模型中多智能体激励的疑难问题,并对不同投票机制所体现的集体能动性程度进行量化评估。本框架旨在为理解、预测和控制多智能体AI系统中涌现的集体能动体提供理论与实证研究基础。

0
下载
关闭预览

相关内容

《多智能体学习中的神经多样性研究》最新200页
专知会员服务
27+阅读 · 2025年9月12日
AI智能体基础设施
专知会员服务
43+阅读 · 2025年7月12日
《集群系统的情境感知能力》223页
专知会员服务
32+阅读 · 2025年4月2日
因果决策综述
专知会员服务
51+阅读 · 2025年3月1日
智能集群系统的强化学习方法综述
专知会员服务
84+阅读 · 2024年1月1日
专知会员服务
98+阅读 · 2021年8月28日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
44+阅读 · 2019年10月16日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
【CPS】社会物理信息系统(CPSS)及其典型应用
产业智能官
16+阅读 · 2018年9月18日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Arxiv
0+阅读 · 4月24日
Arxiv
0+阅读 · 3月1日
VIP会员
相关主题
最新内容
为初级军官战术训练设计生成式人工智能平台
专知会员服务
3+阅读 · 今天6:43
《美军条令:作战伤员后送保障》
专知会员服务
3+阅读 · 今天6:38
《美空军条令出版物 4-0,维持》
专知会员服务
2+阅读 · 今天6:32
《基于仿真的空军任务规划优化》
专知会员服务
2+阅读 · 今天6:21
CVPR 2026教程:统一多模态模型走向收敛之路
专知会员服务
6+阅读 · 6月8日
《人工智能在网络防御中的机遇》
专知会员服务
6+阅读 · 6月8日
相关VIP内容
《多智能体学习中的神经多样性研究》最新200页
专知会员服务
27+阅读 · 2025年9月12日
AI智能体基础设施
专知会员服务
43+阅读 · 2025年7月12日
《集群系统的情境感知能力》223页
专知会员服务
32+阅读 · 2025年4月2日
因果决策综述
专知会员服务
51+阅读 · 2025年3月1日
智能集群系统的强化学习方法综述
专知会员服务
84+阅读 · 2024年1月1日
专知会员服务
98+阅读 · 2021年8月28日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员