Solipsistic Superintelligence is Unlikely to be Cooperative - 专知论文

会员服务 ·

0

设计 · 超级智能 · 系统 · 构建 · 人工智能 ·

Solipsistic Superintelligence is Unlikely to be Cooperative

翻译：唯我论超级智能难以合作

Rakshit S Trivedi,Natasha Jaques,Logan Cross,Alexander Sasha Vezhnevets,Joel Z Leibo

from arxiv, 24 pages, 1 figure, Accepted at Proceedings of the 43rd International Conference on Machine Learning, 2026

AI's central challenge is shifting from capability to coexistence. The dominant paradigm in AI research focuses on developing powerful agents that treat the world as an exogenous and stationary source of feedback. We contend that superintelligence, an extremely capable task solver, born out of such a solipsistic approach to AI design, is unlikely to be cooperative. Deploying AI systems induces endogenous non-stationarity, resulting in a train-test-deploy gap where historical distributions diverge from the deployment context. We refer to this as the self-undermining property of unilateral optimization. Closing this gap requires AI that participates in cooperation: the equilibrium-selection process through which multiple actors navigate their interdependence. We call for a non-solipsistic research paradigm that treats this interdependence as a core design principle rather than approaching cooperation as a task to solve. This entails building dynamic evaluation testbeds involving adaptive counterparties, treating institutions as design primitives, and preserving human agency as a structural feature of the systems we build.

翻译：人工智能的核心挑战正从能力转向共存。当前人工智能研究的主流范式聚焦于开发将世界视为外生且固定反馈源的强大智能体。我们认为，源自这种唯我论式人工智能设计方法的超级智能（一种极其强大的任务求解器）将难以合作。部署人工智能系统会引发内生的非平稳性，导致训练-测试-部署的分布鸿沟——历史数据分布与部署环境产生偏离。我们将此称为单边优化的自损特性。弥合这一鸿沟需要人工智能参与合作：即多个行动者在相互依存关系中通过均衡选择进行协调的过程。我们呼吁建立非唯我论的研究范式，将这种相互依存性视为核心设计原则，而非将合作视为待解决的任务。这意味着需要构建包含自适应对手方的动态测试平台，将制度视为设计原语，并将人类能动性作为所构建系统的结构性特征予以保留。

0

相关内容

设计是对现有状的一种重新认识和打破重组的过程，设计让一切变得更美。

《人工智能绝不能完全自主》

《人工智能绝不能完全自主》

专知会员服务

30+阅读 · 2025年8月4日

《人类与人工智能协作的科学与艺术》284页博士论文

《人类与人工智能协作的科学与艺术》284页博士论文

专知会员服务

23+阅读 · 2025年2月25日

《人类-人工智能握手框架：人与人工智能合作的双向方法》

《人类-人工智能握手框架：人与人工智能合作的双向方法》

专知会员服务

40+阅读 · 2025年2月5日

《人工智能辅助决策面临的三大挑战》最新33页

《人工智能辅助决策面临的三大挑战》最新33页

专知会员服务

53+阅读 · 2025年1月8日

Ilya带头OpenAI超级对齐首篇论文《弱到强的泛化:在弱监督下获得强能力》，AI对齐AI取得实证结果

Ilya带头OpenAI超级对齐首篇论文《弱到强的泛化:在弱监督下获得强能力》，AI对齐AI取得实证结果

专知会员服务

53+阅读 · 2023年12月15日

《人工智能辅助决策面临的三大挑战》

《人工智能辅助决策面临的三大挑战》

专知会员服务

86+阅读 · 2023年12月15日

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

专知会员服务

161+阅读 · 2023年8月23日

《无人智群及其社会融合》最新论文，中国工程院院刊

《无人智群及其社会融合》最新论文，中国工程院院刊

专知会员服务

28+阅读 · 2022年6月20日

【AI+军事】附论文+PPT《机器智能与信任：人工智能对联合作战的影响》，挪威国防研究机构 20号研究所

【AI+军事】附论文+PPT《机器智能与信任：人工智能对联合作战的影响》，挪威国防研究机构 20号研究所

专知会员服务

208+阅读 · 2022年4月10日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

40+阅读 · 2020年1月13日

【人机融合智能】人机融合智能的现状与展望

【人机融合智能】人机融合智能的现状与展望

产业智能官

12+阅读 · 2020年3月18日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

人工智能的现状与未来（附PPT）

人工智能的现状与未来（附PPT）

人工智能学家

76+阅读 · 2019年3月27日

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

专知

18+阅读 · 2019年1月20日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

产业智能官

44+阅读 · 2018年12月11日

人工智能已到瓶颈！院士“联名”反深度学习，并指出AI未来发展方向

人工智能已到瓶颈！院士“联名”反深度学习，并指出AI未来发展方向

算法与数学之美

49+阅读 · 2018年12月2日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

数学是普通程序员入门人工智能的最大障碍

数学是普通程序员入门人工智能的最大障碍

算法与数据结构

12+阅读 · 2018年7月27日

论强化学习的根本缺陷

论强化学习的根本缺陷

AI科技评论

11+阅读 · 2018年7月24日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

CPU和GPU混合体系结构上生物网络比对并行算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

Interaction-Centered Intelligence: Toward an Interaction-Based Theory of Human-AI Co-Creation

Arxiv

0+阅读 · 6月11日

From AGI to ASI

Arxiv

0+阅读 · 6月10日

Existential Indifference: Self-Nonpreservation as a Necessary Architectural Condition for Aligned Superintelligence (or: The Suicidal AI)

Arxiv

0+阅读 · 6月10日

Position: AI Must Become Planet-Centered, Not Just Human-Centered

Arxiv

0+阅读 · 6月9日

Mechanism Design Is Not Enough: Prosocial Agents for Cooperative AI

Arxiv

0+阅读 · 6月2日

Multi-Agent Teams Hold Experts Back

Arxiv

0+阅读 · 5月28日

A Task-Driven Human-AI Collaboration: When to Automate, When to Collaborate, When to Challenge

Arxiv

0+阅读 · 5月22日

Beyond Scaling: Agents Are Heading to the Edge

Arxiv

0+阅读 · 5月18日

Explainable AI Isn't Enough! Rethinking Algorithmic Contestability

Arxiv

0+阅读 · 5月15日

Mechanism Design Is Not Enough: Prosocial Agents for Cooperative AI

Arxiv

0+阅读 · 5月8日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

6+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

3+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

5+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

19+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

13+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

12+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

8+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

13+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

10+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

24+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

12+阅读 · 6月17日

相关VIP内容

《人工智能绝不能完全自主》

《人工智能绝不能完全自主》

专知会员服务

30+阅读 · 2025年8月4日

《人类与人工智能协作的科学与艺术》284页博士论文

《人类与人工智能协作的科学与艺术》284页博士论文

专知会员服务

23+阅读 · 2025年2月25日

《人类-人工智能握手框架：人与人工智能合作的双向方法》

《人类-人工智能握手框架：人与人工智能合作的双向方法》

专知会员服务

40+阅读 · 2025年2月5日

《人工智能辅助决策面临的三大挑战》最新33页

《人工智能辅助决策面临的三大挑战》最新33页

专知会员服务

53+阅读 · 2025年1月8日

Ilya带头OpenAI超级对齐首篇论文《弱到强的泛化:在弱监督下获得强能力》，AI对齐AI取得实证结果

Ilya带头OpenAI超级对齐首篇论文《弱到强的泛化:在弱监督下获得强能力》，AI对齐AI取得实证结果

专知会员服务

53+阅读 · 2023年12月15日

《人工智能辅助决策面临的三大挑战》

《人工智能辅助决策面临的三大挑战》

专知会员服务

86+阅读 · 2023年12月15日

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

大模型和智能体如何结何？人大最新《基于大型语言模型的自主智能体》综述

专知会员服务

161+阅读 · 2023年8月23日

《无人智群及其社会融合》最新论文，中国工程院院刊

《无人智群及其社会融合》最新论文，中国工程院院刊

专知会员服务

28+阅读 · 2022年6月20日

【AI+军事】附论文+PPT《机器智能与信任：人工智能对联合作战的影响》，挪威国防研究机构 20号研究所

【AI+军事】附论文+PPT《机器智能与信任：人工智能对联合作战的影响》，挪威国防研究机构 20号研究所

专知会员服务

208+阅读 · 2022年4月10日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

40+阅读 · 2020年1月13日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

【人机融合智能】人机融合智能的现状与展望

【人机融合智能】人机融合智能的现状与展望

产业智能官

12+阅读 · 2020年3月18日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

人工智能的现状与未来（附PPT）

人工智能的现状与未来（附PPT）

人工智能学家

76+阅读 · 2019年3月27日

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

专知

18+阅读 · 2019年1月20日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

【人工智能】有关军事混合智能的几点再再思考、深绿” 及 AlphaGo 对指挥与控制智能化的启示

产业智能官

44+阅读 · 2018年12月11日

人工智能已到瓶颈！院士“联名”反深度学习，并指出AI未来发展方向

人工智能已到瓶颈！院士“联名”反深度学习，并指出AI未来发展方向

算法与数学之美

49+阅读 · 2018年12月2日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

数学是普通程序员入门人工智能的最大障碍

数学是普通程序员入门人工智能的最大障碍

算法与数据结构

12+阅读 · 2018年7月27日

论强化学习的根本缺陷

论强化学习的根本缺陷

AI科技评论

11+阅读 · 2018年7月24日

相关论文

Interaction-Centered Intelligence: Toward an Interaction-Based Theory of Human-AI Co-Creation

Arxiv

0+阅读 · 6月11日

From AGI to ASI

Arxiv

0+阅读 · 6月10日

Existential Indifference: Self-Nonpreservation as a Necessary Architectural Condition for Aligned Superintelligence (or: The Suicidal AI)

Arxiv

0+阅读 · 6月10日

Position: AI Must Become Planet-Centered, Not Just Human-Centered

Arxiv

0+阅读 · 6月9日

Mechanism Design Is Not Enough: Prosocial Agents for Cooperative AI

Arxiv

0+阅读 · 6月2日

Multi-Agent Teams Hold Experts Back

Arxiv

0+阅读 · 5月28日

A Task-Driven Human-AI Collaboration: When to Automate, When to Collaborate, When to Challenge

Arxiv

0+阅读 · 5月22日

Beyond Scaling: Agents Are Heading to the Edge

Arxiv

0+阅读 · 5月18日

Explainable AI Isn't Enough! Rethinking Algorithmic Contestability

Arxiv

0+阅读 · 5月15日

Mechanism Design Is Not Enough: Prosocial Agents for Cooperative AI

Arxiv

0+阅读 · 5月8日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

输入约束下的多智能体系统完全分布式协调控制研究

国家自然科学基金

5+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

CPU和GPU混合体系结构上生物网络比对并行算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员