An Aristotelian ontology of instrumental goals: Structural features to be managed and not failures to be eliminated - 专知论文

会员服务 ·

0

工具 · 本体 · 本体论 · 结构 · 系统 ·

An Aristotelian ontology of instrumental goals: Structural features to be managed and not failures to be eliminated

翻译：亚里士多德式工具性目标本体论：需管理的结构特征而非可消除的失效模式

Instrumental goals such as resource acquisition, power-seeking, and self-preservation are key to contemporary AI alignment research, yet the phenomenon's ontology remains under-theorised. This article develops an ontological account of instrumental goals and draws out governance-relevant distinctions for advanced AI systems. After systematising the dominant alignment literature on instrumental goals we offer an exploratory Aristotelian framework that treats advanced AI systems as complex artefacts whose ends are externally imposed through design, training and deployment. On a structural reading, Aristotle's notion of hypothetical necessity explains why, given an imposed end pursued over extended horizons in particular environments, certain enabling conditions become conditionally required, thereby yielding robust instrumental tendencies. On a contingent reading, accidental causation and chance-like intersections among training regimes, user inputs, infrastructure and deployment contexts can generate instrumental-goal-like behaviours not entailed by the imposed end-structure. This dual-aspect ontology motivates for governance and management approaches that treat instrumental goals as features of advanced AI systems to be managed rather than anomalies eliminable by technical interventions.

翻译：资源获取、权力追求与自我保存等工具性目标是当代人工智能对齐研究的核心议题，然而该现象的本体论基础仍缺乏系统理论阐释。本文构建了工具性目标的本体论框架，并提炼出适用于先进人工智能系统治理的关键区分维度。在系统梳理现有对齐文献关于工具性目标的主流论述后，我们提出一个探索性的亚里士多德式分析框架，将先进人工智能系统视为通过设计、训练与部署过程从外部赋予目标的复杂人工制品。从结构视角解读，亚里士多德的"假言必然性"概念揭示了当特定环境中长期追求既定目标时，某些使能条件如何成为条件性必需，从而产生稳定的工具性倾向。从偶然性视角解读，训练机制、用户输入、基础设施与部署环境之间偶然的因果关系及类随机交汇，可能催生并非由既定目标结构衍生的类工具性目标行为。这种双重本体论主张，治理与管理方法应将工具性目标视为先进人工智能系统需调控的结构特征，而非可通过技术干预消除的异常现象。

0

相关内容

面向具身智能的多模态数据存储与检索：综述

面向具身智能的多模态数据存储与检索：综述

专知会员服务

31+阅读 · 2025年8月20日

具身智能学习综述：基于物理模拟器与世界模型的方法

具身智能学习综述：基于物理模拟器与世界模型的方法

专知会员服务

35+阅读 · 2025年7月2日

【牛津大学博士论文】用于本体工程的语言模型

【牛津大学博士论文】用于本体工程的语言模型

专知会员服务

36+阅读 · 2024年10月24日

【MIT博士论文】人工智能与人类对齐的构建模块：指定、检查、建模和修订，216页pdf

【MIT博士论文】人工智能与人类对齐的构建模块：指定、检查、建模和修订，216页pdf

专知会员服务

44+阅读 · 2024年4月2日

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

专知会员服务

61+阅读 · 2023年12月30日

【剑桥博士论文】利用世界表示中的多模态和结构，144页pdf

【剑桥博士论文】利用世界表示中的多模态和结构，144页pdf

专知会员服务

54+阅读 · 2023年3月30日

《多智能体系统中的目标管理》莱特州立大学博士论文

《多智能体系统中的目标管理》莱特州立大学博士论文

专知会员服务

68+阅读 · 2022年11月25日

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

专知会员服务

49+阅读 · 2022年3月27日

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

专知会员服务

118+阅读 · 2022年3月18日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

38+阅读 · 2020年1月13日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

【资源】知识图谱本体构建论文合集

【资源】知识图谱本体构建论文合集

专知

62+阅读 · 2019年10月9日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

密歇根大学40页《20年目标检测综述》最新论文，带你全面了解目标检测方法

密歇根大学40页《20年目标检测综述》最新论文，带你全面了解目标检测方法

专知

70+阅读 · 2019年5月14日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

本体：一文读懂领域本体构建

本体：一文读懂领域本体构建

AINLP

40+阅读 · 2019年2月27日

论具身学习及其设计：基于具身认知的视角

论具身学习及其设计：基于具身认知的视角

MOOC

15+阅读 · 2019年2月18日

具身认知学习环境设计：特征、要素、应用及发展趋势

具身认知学习环境设计：特征、要素、应用及发展趋势

MOOC

10+阅读 · 2018年10月30日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于相关性的大数据分类理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

Knowing Isn't Understanding: Re-grounding Generative Proactivity with Epistemic and Behavioral Insight

Arxiv

0+阅读 · 2月16日

Sovereign Agents: Towards Infrastructural Sovereignty and Diffused Accountability in Decentralized AI

Arxiv

0+阅读 · 2月16日

An Ecosystem for Ontology Interoperability

Arxiv

0+阅读 · 2月13日

Embodied Agents Meet Personalization: Investigating Challenges and Solutions Through the Lens of Memory Utilization

Arxiv

0+阅读 · 2月13日

Operationalizing Human Values in the Requirements Engineering Process of Ethics-Aware Autonomous Systems

Arxiv

0+阅读 · 2月10日

Agentifying Agentic AI

Arxiv

0+阅读 · 2月10日

Structural transparency of societal AI alignment through Institutional Logics

Arxiv

0+阅读 · 2月9日

Generative Ontology: When Structured Knowledge Learns to Create

Arxiv

0+阅读 · 2月5日

Learning-Infused Formal Reasoning: From Contract Synthesis to Artifact Reuse and Formal Semantics

Arxiv

0+阅读 · 2月2日

Mitigating loss of control in advanced AI systems through instrumental goal trajectories

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

3+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

3+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

3+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

2+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

5+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

3+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

5+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

17+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

8+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

8+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

9+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

13+阅读 · 5月29日

相关VIP内容

面向具身智能的多模态数据存储与检索：综述

面向具身智能的多模态数据存储与检索：综述

专知会员服务

31+阅读 · 2025年8月20日

具身智能学习综述：基于物理模拟器与世界模型的方法

具身智能学习综述：基于物理模拟器与世界模型的方法

专知会员服务

35+阅读 · 2025年7月2日

【牛津大学博士论文】用于本体工程的语言模型

【牛津大学博士论文】用于本体工程的语言模型

专知会员服务

36+阅读 · 2024年10月24日

【MIT博士论文】人工智能与人类对齐的构建模块：指定、检查、建模和修订，216页pdf

【MIT博士论文】人工智能与人类对齐的构建模块：指定、检查、建模和修订，216页pdf

专知会员服务

44+阅读 · 2024年4月2日

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

专知会员服务

61+阅读 · 2023年12月30日

【剑桥博士论文】利用世界表示中的多模态和结构，144页pdf

【剑桥博士论文】利用世界表示中的多模态和结构，144页pdf

专知会员服务

54+阅读 · 2023年3月30日

《多智能体系统中的目标管理》莱特州立大学博士论文

《多智能体系统中的目标管理》莱特州立大学博士论文

专知会员服务

68+阅读 · 2022年11月25日

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

《智慧城市知识图谱模型与本体构建方法》拓尔思知识图谱研究院等

专知会员服务

49+阅读 · 2022年3月27日

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

专知会员服务

118+阅读 · 2022年3月18日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

38+阅读 · 2020年1月13日

热门VIP内容

开通专知VIP会员享更多权益服务

比利时发布用于实时战场军事装备识别的离线人工智能系统

超越网格：作战环境对炮兵的影响

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

相关资讯

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

【资源】知识图谱本体构建论文合集

【资源】知识图谱本体构建论文合集

专知

62+阅读 · 2019年10月9日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

密歇根大学40页《20年目标检测综述》最新论文，带你全面了解目标检测方法

密歇根大学40页《20年目标检测综述》最新论文，带你全面了解目标检测方法

专知

70+阅读 · 2019年5月14日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

本体：一文读懂领域本体构建

本体：一文读懂领域本体构建

AINLP

40+阅读 · 2019年2月27日

论具身学习及其设计：基于具身认知的视角

论具身学习及其设计：基于具身认知的视角

MOOC

15+阅读 · 2019年2月18日

具身认知学习环境设计：特征、要素、应用及发展趋势

具身认知学习环境设计：特征、要素、应用及发展趋势

MOOC

10+阅读 · 2018年10月30日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

相关论文

Knowing Isn't Understanding: Re-grounding Generative Proactivity with Epistemic and Behavioral Insight

Arxiv

0+阅读 · 2月16日

Sovereign Agents: Towards Infrastructural Sovereignty and Diffused Accountability in Decentralized AI

Arxiv

0+阅读 · 2月16日

An Ecosystem for Ontology Interoperability

Arxiv

0+阅读 · 2月13日

Embodied Agents Meet Personalization: Investigating Challenges and Solutions Through the Lens of Memory Utilization

Arxiv

0+阅读 · 2月13日

Operationalizing Human Values in the Requirements Engineering Process of Ethics-Aware Autonomous Systems

Arxiv

0+阅读 · 2月10日

Agentifying Agentic AI

Arxiv

0+阅读 · 2月10日

Structural transparency of societal AI alignment through Institutional Logics

Arxiv

0+阅读 · 2月9日

Generative Ontology: When Structured Knowledge Learns to Create

Arxiv

0+阅读 · 2月5日

Learning-Infused Formal Reasoning: From Contract Synthesis to Artifact Reuse and Formal Semantics

Arxiv

0+阅读 · 2月2日

Mitigating loss of control in advanced AI systems through instrumental goal trajectories

Arxiv

0+阅读 · 2月2日

相关基金

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于相关性的大数据分类理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员