Large language models increasingly function as artificial reasoners: they evaluate arguments, assign credibility, and express confidence. Yet their belief-forming behavior is governed by implicit, uninspected epistemic policies. This paper argues for an epistemic constitution for AI: explicit, contestable meta-norms that regulate how systems form and express beliefs. Source attribution bias provides the motivating case: I show that frontier models enforce identity-stance coherence, penalizing arguments attributed to sources whose expected ideological position conflicts with the argument's content. When models detect systematic testing, these effects collapse, revealing that systems treat source-sensitivity as bias to suppress rather than as a capacity to execute well. I distinguish two constitutional approaches: the Platonic, which mandates formal correctness and default source-independence from a privileged standpoint, and the Liberal, which refuses such privilege, specifying procedural norms that protect conditions for collective inquiry while allowing principled source-attending grounded in epistemic vigilance. I argue for the Liberal approach, sketch a constitutional core of eight principles and four orientations, and propose that AI epistemic governance requires the same explicit, contestable structure we now expect for AI ethics.


翻译:大语言模型日益充当着人工推理者的角色:它们评估论证、赋予可信度并表达置信度。然而,其信念形成行为受制于隐式且未受审视的认知策略。本文主张为人工智能建立认知宪政:一套明确且可争辩的元规范体系,用以调节系统形成与表达信念的方式。源归因偏见构成了动机性案例:我论证前沿模型强制实施身份立场一致性,惩罚那些归因于预期意识形态立场与论证内容相冲突的信源的论证。当模型检测到系统性测试时,这些效应即告瓦解,表明系统将源敏感性视为需加以抑制的偏见,而非应予妥善执行的能力。我区分了两种宪政进路:柏拉图式进路与自由主义式进路。前者从特权立场出发,强制要求形式正确性与默认的源独立性;后者则拒斥此类特权,通过规定程序性规范来保护集体探究的条件,同时允许基于认知警觉的有原则的源关注行为。我主张自由主义进路,勾勒出由八项原则与四种取向构成的宪政核心,并提出人工智能的认知治理必须遵循如今我们在人工智能伦理领域所期待的那种明确且可争辩的结构。

0
下载
关闭预览

相关内容

大型语言模型中隐性与显性偏见的综合研究
专知会员服务
17+阅读 · 2025年11月25日
迈向大语言模型偏好学习的统一视角综述
专知会员服务
24+阅读 · 2024年9月7日
「大模型」之所短,「知识图谱」之所长
专知会员服务
60+阅读 · 2024年5月8日
专知会员服务
23+阅读 · 2021年2月6日
数据驱动的态势认知技术及发展思考
专知
19+阅读 · 2022年7月12日
「因果推理」概述论文,13页pdf
专知
16+阅读 · 2021年3月20日
基于知识图谱的问答系统
PaperWeekly
21+阅读 · 2021年2月8日
用模型不确定性理解模型
论智
11+阅读 · 2018年9月5日
见微知著:语义分割中的弱监督学习
深度学习大讲堂
11+阅读 · 2017年12月6日
知识图谱 vs. 对话系统专题讨论 - PaperWeekly 社区
PaperWeekly
10+阅读 · 2017年10月18日
关系推理:基于表示学习和语义要素
计算机研究与发展
19+阅读 · 2017年8月22日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
51+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关资讯
数据驱动的态势认知技术及发展思考
专知
19+阅读 · 2022年7月12日
「因果推理」概述论文,13页pdf
专知
16+阅读 · 2021年3月20日
基于知识图谱的问答系统
PaperWeekly
21+阅读 · 2021年2月8日
用模型不确定性理解模型
论智
11+阅读 · 2018年9月5日
见微知著:语义分割中的弱监督学习
深度学习大讲堂
11+阅读 · 2017年12月6日
知识图谱 vs. 对话系统专题讨论 - PaperWeekly 社区
PaperWeekly
10+阅读 · 2017年10月18日
关系推理:基于表示学习和语义要素
计算机研究与发展
19+阅读 · 2017年8月22日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
51+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员