As AI assistants become integrated into safety engineering workflows for Physical AI systems, a critical question emerges: does AI assistance improve safety analysis quality, or introduce systematic blind spots that surface only through post-deployment incidents? This paper develops a formal framework for AI assistance in safety analysis. We first establish why safety engineering resists benchmark-driven evaluation: safety competence is irreducibly multidimensional, constrained by context-dependent correctness, inherent incompleteness, and legitimate expert disagreement. We formalize this through a five-dimensional competence framework capturing domain knowledge, standards expertise, operational experience, contextual understanding, and judgment. We introduce the competence shadow: the systematic narrowing of human reasoning induced by AI-generated safety analysis. The shadow is not what the AI presents, but what it prevents from being considered. We formalize four canonical human-AI collaboration structures and derive closed-form performance bounds, demonstrating that the competence shadow compounds multiplicatively to produce degradation far exceeding naive additive estimates. The central finding is that AI assistance in safety engineering is a collaboration design problem, not a software procurement decision. The same tool degrades or improves analysis quality depending entirely on how it is used. We derive non-degradation conditions for shadow-resistant workflows and call for a shift from tool qualification toward workflow qualification for trustworthy Physical AI.


翻译:随着人工智能助手融入物理AI系统的安全工程工作流,一个关键问题浮现:AI辅助是提升了安全分析质量,还是引入了系统性盲区,这些盲区仅在部署后的事故中才显露?本文构建了安全分析中AI辅助的形式化框架。我们首先阐明安全工程为何抗拒基准驱动评估:安全能力具有不可约的多维性,受限于上下文相关的正确性、固有不完备性以及领域专家的合理分歧。我们通过五维能力框架对此进行形式化,涵盖领域知识、标准专长、操作经验、情境理解与判断力。我们提出"能力盲区"概念:AI生成的安全分析导致的人类推理系统性收窄。盲区并非AI呈现的内容,而是它阻止人类考虑的内容。我们形式化了四种典型的人机协作结构,并推导出闭式性能边界,证明能力盲区会以乘法方式复合累积,产生远超朴素加法估计的性能退化。核心发现是:安全工程中的AI辅助本质上是协作设计问题,而非软件采购决策。同一工具对分析质量的提升或削弱完全取决于其使用方式。我们推导了抗盲区工作流的非退化条件,并呼吁从工具资格认证转向工作流资格认证,以实现可信赖的物理AI系统。

0
下载
关闭预览

相关内容

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文,这些论文构成了整个领域的进步,也欢迎介绍人工智能应用的论文,但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能,而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案,强调其新颖性,并对正在开发的人工智能技术进行深入的评估。 官网地址:http://dblp.uni-trier.de/db/journals/ai/
《人工智能在网络防御中的机遇》
专知会员服务
9+阅读 · 6月8日
中文版 | 人工智能在军事情报领域催生新型危险盲区
专知会员服务
21+阅读 · 2025年7月16日
人工智能如何增强军事监控与边境安全
专知会员服务
21+阅读 · 2025年3月20日
专知会员服务
64+阅读 · 2021年7月5日
专知会员服务
47+阅读 · 2021年6月25日
视频分析中的人工智能 (AI)白皮书,16页pdf
专知会员服务
68+阅读 · 2021年5月6日
《人工智能安全测评白皮书》,99页pdf
专知
36+阅读 · 2022年2月26日
边缘智能发展与演进白皮书
物联网智库
13+阅读 · 2019年6月17日
人工智能对网络空间安全的影响
走向智能论坛
21+阅读 · 2018年6月7日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
3+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关VIP内容
《人工智能在网络防御中的机遇》
专知会员服务
9+阅读 · 6月8日
中文版 | 人工智能在军事情报领域催生新型危险盲区
专知会员服务
21+阅读 · 2025年7月16日
人工智能如何增强军事监控与边境安全
专知会员服务
21+阅读 · 2025年3月20日
专知会员服务
64+阅读 · 2021年7月5日
专知会员服务
47+阅读 · 2021年6月25日
视频分析中的人工智能 (AI)白皮书,16页pdf
专知会员服务
68+阅读 · 2021年5月6日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员