Governance theory presupposes a rough cognitive comparability between governors and governed. This paper makes that assumption explicit and testable through a six-dimension evaluation framework covering legitimacy, accountability, corrigibility, non-domination, subsidiarity, and institutional resilience, drawn from political legitimacy theory, principal-agent models, republican theory, and the AI alignment literature. The framework is first demonstrated on existing non-majoritarian institutions, where capability asymmetry is real but bounded, and then applied to a prospective case of bounded superintelligent authority, where the asymmetry is radical. Four of six dimensions show structural failures. Two of the four appear tractable to institutional design (subsidiarity scope limitation and institutional resilience). The other two, the public reason problem under cognitive incomprehensibility and the non-domination problem under permanent capability asymmetry, call for new normative theory rather than better institutional design. The analysis also finds that dimensions which operate as independent checks under bounded asymmetry begin to degrade together under radical asymmetry, because each depends on the same oversight capacity. The assumptions that allowed these checks to remain independent have gone unexamined so far because they have always held.


翻译:治理理论预设治理者与被治理者之间存在一种粗略的认知可比性。本文通过构建一个涵盖合法性、问责性、可纠正性、非支配性、辅助性与制度韧性的六维度评估框架,将这一假设显性化并使之可检验,该框架融合了政治合法性理论、委托-代理模型、共和主义理论及AI对齐研究。首先以现有非多数主义机构为对象验证该框架——这些机构中能力不对称真实存在但有限——随后将其应用于一个假定案例:有限的超级智能权威,其中能力不对称呈现激进特征。六个维度中,四个出现结构性失效。其中两个(辅助性范围限制与制度韧性)似乎可通过制度设计解决;另两个——认知不可理解下的公共理性问题与永久性能力不对称下的非支配问题——则需要新的规范性理论,而非更好的制度设计。分析还发现,在有限不对称条件下作为独立制衡的维度,在激进不对称下开始共同退化,原因在于每个维度都依赖于相同的监督能力。由于这些制衡机制赖以保持独立的假设一直成立,此前从未受到审视。

0
下载
关闭预览

相关内容

制度是包括为社会生活提供稳定性和意义的强制性、规范性和文化认同性要素所构成的社会活动和资源。
《基于理论的威慑效能评估》
专知会员服务
12+阅读 · 5月28日
论学习、公平性与复杂度
专知会员服务
11+阅读 · 2月28日
认知优势:人工智能在国家安全决策中的核心作用
专知会员服务
15+阅读 · 2025年8月16日
重磅!《“可信AI”评估体系产品手册》正式发布,24页pdf
专知会员服务
76+阅读 · 2023年7月4日
数据驱动的态势认知技术及发展思考
专知会员服务
154+阅读 · 2022年7月12日
数据驱动的态势认知技术及发展思考
专知
19+阅读 · 2022年7月12日
「强化学习可解释性」最新2022综述
专知
12+阅读 · 2022年1月16日
【干货】监督学习与无监督学习简介
专知
14+阅读 · 2018年4月4日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月10日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员