Cognitive Comparability and the Limits of Governance: Evaluating Authority Under Radical Capability Asymmetry - 专知论文

会员服务 ·

0

制度 · 设计 · 构建 · 问责 · 融合 ·

Cognitive Comparability and the Limits of Governance: Evaluating Authority Under Radical Capability Asymmetry

翻译：认知可比性与治理的边界：评估激进能力不对称下的权威

from arxiv, 20 pages, 2 tables. Interdisciplinary paper on AI governance and political theory

Governance theory presupposes a rough cognitive comparability between governors and governed. This paper makes that assumption explicit and testable through a six-dimension evaluation framework covering legitimacy, accountability, corrigibility, non-domination, subsidiarity, and institutional resilience, drawn from political legitimacy theory, principal-agent models, republican theory, and the AI alignment literature. The framework is first demonstrated on existing non-majoritarian institutions, where capability asymmetry is real but bounded, and then applied to a prospective case of bounded superintelligent authority, where the asymmetry is radical. Four of six dimensions show structural failures. Two of the four appear tractable to institutional design (subsidiarity scope limitation and institutional resilience). The other two, the public reason problem under cognitive incomprehensibility and the non-domination problem under permanent capability asymmetry, call for new normative theory rather than better institutional design. The analysis also finds that dimensions which operate as independent checks under bounded asymmetry begin to degrade together under radical asymmetry, because each depends on the same oversight capacity. The assumptions that allowed these checks to remain independent have gone unexamined so far because they have always held.

翻译：治理理论预设治理者与被治理者之间存在一种粗略的认知可比性。本文通过构建一个涵盖合法性、问责性、可纠正性、非支配性、辅助性与制度韧性的六维度评估框架，将这一假设显性化并使之可检验，该框架融合了政治合法性理论、委托-代理模型、共和主义理论及AI对齐研究。首先以现有非多数主义机构为对象验证该框架——这些机构中能力不对称真实存在但有限——随后将其应用于一个假定案例：有限的超级智能权威，其中能力不对称呈现激进特征。六个维度中，四个出现结构性失效。其中两个（辅助性范围限制与制度韧性）似乎可通过制度设计解决；另两个——认知不可理解下的公共理性问题与永久性能力不对称下的非支配问题——则需要新的规范性理论，而非更好的制度设计。分析还发现，在有限不对称条件下作为独立制衡的维度，在激进不对称下开始共同退化，原因在于每个维度都依赖于相同的监督能力。由于这些制衡机制赖以保持独立的假设一直成立，此前从未受到审视。

0

相关内容

制度是包括为社会生活提供稳定性和意义的强制性、规范性和文化认同性要素所构成的社会活动和资源。

《基于理论的威慑效能评估》

《基于理论的威慑效能评估》

专知会员服务

12+阅读 · 5月28日

论学习、公平性与复杂度

论学习、公平性与复杂度

专知会员服务

11+阅读 · 2月28日

《跨领域人工智能感知：公众态度的比较性述评》最新65页

《跨领域人工智能感知：公众态度的比较性述评》最新65页

专知会员服务

8+阅读 · 2025年10月8日

认知优势：人工智能在国家安全决策中的核心作用

认知优势：人工智能在国家安全决策中的核心作用

专知会员服务

15+阅读 · 2025年8月16日

《人工智能治理实施的挑战与应对策略：系统性文献综述》最新97页

《人工智能治理实施的挑战与应对策略：系统性文献综述》最新97页

专知会员服务

25+阅读 · 2025年7月24日

重磅!《“可信AI”评估体系产品手册》正式发布,24页pdf

重磅!《“可信AI”评估体系产品手册》正式发布,24页pdf

专知会员服务

76+阅读 · 2023年7月4日

数据驱动的态势认知技术及发展思考

数据驱动的态势认知技术及发展思考

专知会员服务

154+阅读 · 2022年7月12日

【重磅】迈向可信赖的人工智能，59位作者，80页pdf阐述Trustworthy AI可验证声明的支持机制

【重磅】迈向可信赖的人工智能，59位作者，80页pdf阐述Trustworthy AI可验证声明的支持机制

专知会员服务

63+阅读 · 2020年4月16日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

40+阅读 · 2020年1月13日

【AAAI 2019 Tutorial】不确定性下基于知识的顺序决策（Knowledge-based Sequential Decision-Making under Uncertainty），张世琦，Mohan Sridharan

【AAAI 2019 Tutorial】不确定性下基于知识的顺序决策（Knowledge-based Sequential Decision-Making under Uncertainty），张世琦，Mohan Sridharan

专知会员服务

13+阅读 · 2019年11月18日

数据驱动的态势认知技术及发展思考

数据驱动的态势认知技术及发展思考

专知

19+阅读 · 2022年7月12日

「强化学习可解释性」最新2022综述

「强化学习可解释性」最新2022综述

专知

12+阅读 · 2022年1月16日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

AINLP

19+阅读 · 2020年6月14日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

具身认知学习环境设计：特征、要素、应用及发展趋势

具身认知学习环境设计：特征、要素、应用及发展趋势

MOOC

10+阅读 · 2018年10月30日

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

产业智能官

49+阅读 · 2018年7月4日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【干货】监督学习与无监督学习简介

【干货】监督学习与无监督学习简介

专知

14+阅读 · 2018年4月4日

社会信任程度对于审计师行为的影响及经济后果研究——基于事务所和签字审计师层面

国家自然科学基金

0+阅读 · 2015年12月31日

跨感觉通道冲突控制的认知神经机制研究及调节系统建立

国家自然科学基金

1+阅读 · 2015年12月31日

公共组织跨部门知识共享机理、绩效激励与实现机制重塑研究

国家自然科学基金

0+阅读 · 2015年12月31日

云计算环境信任链系统安全性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

在线服务信誉可比较性及其保障机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

互联网金融三维信任机制及参与者信任感知与交易决策

国家自然科学基金

0+阅读 · 2014年12月31日

基于学科—专业—产业链的区域高等教育协同创新治理机制研究

国家自然科学基金

1+阅读 · 2014年12月31日

官员异质性、社会信任与企业资源配置

国家自然科学基金

0+阅读 · 2014年12月31日

基于构件的可信软件构造及其行为动态可信测评

国家自然科学基金

1+阅读 · 2014年12月31日

Cognitive Debt: AI as Intellectual Leverage and the Dynamics of Systemic Fragility

Arxiv

0+阅读 · 6月13日

Epistemic Constitutionalism Or: how to avoid coherence bias

Arxiv

0+阅读 · 6月11日

SAGE: Scalable AI Governance & Evaluation

Arxiv

0+阅读 · 6月10日

Political Neutrality as Balanced Approval: A Large-Scale Human Evaluation of AI Responses

Arxiv

0+阅读 · 5月27日

Certified Purity for Cognitive Workflow Executors: From Static Analysis to Cryptographic Attestation

Arxiv

0+阅读 · 5月26日

The Behavioral Credibility Trilemma: When Calibrated Autonomy Becomes Impossible

Arxiv

0+阅读 · 5月25日

The Deterministic Horizon: Impossibility Results as Design Specifications for Trustworthy AI Systems

Arxiv

0+阅读 · 5月21日

Upholding Epistemic Agency: A Brouwerian Assertibility Constraint for Responsible AI

Arxiv

0+阅读 · 5月9日

Limitations on Accurate, Trusted, Human-level Reasoning

Arxiv

0+阅读 · 5月7日

Beyond Ability: The Four-Fold Spectrum of Power and the Logic of Full Inability

Arxiv

0+阅读 · 5月6日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

3+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

5+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

15+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

《基于理论的威慑效能评估》

《基于理论的威慑效能评估》

专知会员服务

12+阅读 · 5月28日

论学习、公平性与复杂度

论学习、公平性与复杂度

专知会员服务

11+阅读 · 2月28日

《跨领域人工智能感知：公众态度的比较性述评》最新65页

《跨领域人工智能感知：公众态度的比较性述评》最新65页

专知会员服务

8+阅读 · 2025年10月8日

认知优势：人工智能在国家安全决策中的核心作用

认知优势：人工智能在国家安全决策中的核心作用

专知会员服务

15+阅读 · 2025年8月16日

《人工智能治理实施的挑战与应对策略：系统性文献综述》最新97页

《人工智能治理实施的挑战与应对策略：系统性文献综述》最新97页

专知会员服务

25+阅读 · 2025年7月24日

重磅!《“可信AI”评估体系产品手册》正式发布,24页pdf

重磅!《“可信AI”评估体系产品手册》正式发布,24页pdf

专知会员服务

76+阅读 · 2023年7月4日

数据驱动的态势认知技术及发展思考

数据驱动的态势认知技术及发展思考

专知会员服务

154+阅读 · 2022年7月12日

【重磅】迈向可信赖的人工智能，59位作者，80页pdf阐述Trustworthy AI可验证声明的支持机制

【重磅】迈向可信赖的人工智能，59位作者，80页pdf阐述Trustworthy AI可验证声明的支持机制

专知会员服务

63+阅读 · 2020年4月16日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

40+阅读 · 2020年1月13日

【AAAI 2019 Tutorial】不确定性下基于知识的顺序决策（Knowledge-based Sequential Decision-Making under Uncertainty），张世琦，Mohan Sridharan

【AAAI 2019 Tutorial】不确定性下基于知识的顺序决策（Knowledge-based Sequential Decision-Making under Uncertainty），张世琦，Mohan Sridharan

专知会员服务

13+阅读 · 2019年11月18日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

数据驱动的态势认知技术及发展思考

数据驱动的态势认知技术及发展思考

专知

19+阅读 · 2022年7月12日

「强化学习可解释性」最新2022综述

「强化学习可解释性」最新2022综述

专知

12+阅读 · 2022年1月16日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

AINLP

19+阅读 · 2020年6月14日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知

31+阅读 · 2020年4月28日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

具身认知学习环境设计：特征、要素、应用及发展趋势

具身认知学习环境设计：特征、要素、应用及发展趋势

MOOC

10+阅读 · 2018年10月30日

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

【强化学习】强化学习与控制理论的区别与联系；深度强化学习的课程笔记。

产业智能官

49+阅读 · 2018年7月4日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【干货】监督学习与无监督学习简介

【干货】监督学习与无监督学习简介

专知

14+阅读 · 2018年4月4日

相关论文

Cognitive Debt: AI as Intellectual Leverage and the Dynamics of Systemic Fragility

Arxiv

0+阅读 · 6月13日

Epistemic Constitutionalism Or: how to avoid coherence bias

Arxiv

0+阅读 · 6月11日

SAGE: Scalable AI Governance & Evaluation

Arxiv

0+阅读 · 6月10日

Political Neutrality as Balanced Approval: A Large-Scale Human Evaluation of AI Responses

Arxiv

0+阅读 · 5月27日

Certified Purity for Cognitive Workflow Executors: From Static Analysis to Cryptographic Attestation

Arxiv

0+阅读 · 5月26日

The Behavioral Credibility Trilemma: When Calibrated Autonomy Becomes Impossible

Arxiv

0+阅读 · 5月25日

The Deterministic Horizon: Impossibility Results as Design Specifications for Trustworthy AI Systems

Arxiv

0+阅读 · 5月21日

Upholding Epistemic Agency: A Brouwerian Assertibility Constraint for Responsible AI

Arxiv

0+阅读 · 5月9日

Limitations on Accurate, Trusted, Human-level Reasoning

Arxiv

0+阅读 · 5月7日

Beyond Ability: The Four-Fold Spectrum of Power and the Logic of Full Inability

Arxiv

0+阅读 · 5月6日

相关基金

社会信任程度对于审计师行为的影响及经济后果研究——基于事务所和签字审计师层面

国家自然科学基金

0+阅读 · 2015年12月31日

跨感觉通道冲突控制的认知神经机制研究及调节系统建立

国家自然科学基金

1+阅读 · 2015年12月31日

公共组织跨部门知识共享机理、绩效激励与实现机制重塑研究

国家自然科学基金

0+阅读 · 2015年12月31日

云计算环境信任链系统安全性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

在线服务信誉可比较性及其保障机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

互联网金融三维信任机制及参与者信任感知与交易决策

国家自然科学基金

0+阅读 · 2014年12月31日

基于学科—专业—产业链的区域高等教育协同创新治理机制研究

国家自然科学基金

1+阅读 · 2014年12月31日

官员异质性、社会信任与企业资源配置

国家自然科学基金

0+阅读 · 2014年12月31日

基于构件的可信软件构造及其行为动态可信测评

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员