Instrumental goals such as resource acquisition, power-seeking, and self-preservation are key to contemporary AI alignment research, yet the phenomenon's ontology remains under-theorised. This article develops an ontological account of instrumental goals and draws out governance-relevant distinctions for advanced AI systems. After systematising the dominant alignment literature on instrumental goals we offer an exploratory Aristotelian framework that treats advanced AI systems as complex artefacts whose ends are externally imposed through design, training and deployment. On a structural reading, Aristotle's notion of hypothetical necessity explains why, given an imposed end pursued over extended horizons in particular environments, certain enabling conditions become conditionally required, thereby yielding robust instrumental tendencies. On a contingent reading, accidental causation and chance-like intersections among training regimes, user inputs, infrastructure and deployment contexts can generate instrumental-goal-like behaviours not entailed by the imposed end-structure. This dual-aspect ontology motivates for governance and management approaches that treat instrumental goals as features of advanced AI systems to be managed rather than anomalies eliminable by technical interventions.


翻译:资源获取、权力追求与自我保存等工具性目标是当代人工智能对齐研究的核心议题,然而该现象的本体论基础仍缺乏系统理论阐释。本文构建了工具性目标的本体论框架,并提炼出适用于先进人工智能系统治理的关键区分维度。在系统梳理现有对齐文献关于工具性目标的主流论述后,我们提出一个探索性的亚里士多德式分析框架,将先进人工智能系统视为通过设计、训练与部署过程从外部赋予目标的复杂人工制品。从结构视角解读,亚里士多德的"假言必然性"概念揭示了当特定环境中长期追求既定目标时,某些使能条件如何成为条件性必需,从而产生稳定的工具性倾向。从偶然性视角解读,训练机制、用户输入、基础设施与部署环境之间偶然的因果关系及类随机交汇,可能催生并非由既定目标结构衍生的类工具性目标行为。这种双重本体论主张,治理与管理方法应将工具性目标视为先进人工智能系统需调控的结构特征,而非可通过技术干预消除的异常现象。

0
下载
关闭预览

相关内容

面向具身智能的多模态数据存储与检索:综述
专知会员服务
29+阅读 · 2025年8月20日
具身智能学习综述:基于物理模拟器与世界模型的方法
专知会员服务
32+阅读 · 2025年7月2日
【牛津大学博士论文】用于本体工程的语言模型
专知会员服务
34+阅读 · 2024年10月24日
《多智能体系统中的目标管理》莱特州立大学博士论文
专知会员服务
68+阅读 · 2022年11月25日
【资源】知识图谱本体构建论文合集
专知
61+阅读 · 2019年10月9日
本体:一文读懂领域本体构建
AINLP
40+阅读 · 2019年2月27日
特征工程的特征理解(一)
机器学习研究会
10+阅读 · 2017年10月23日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月13日
Arxiv
0+阅读 · 2月10日
VIP会员
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员