Frontier AI is becoming critical societal infrastructure, but outsiders lack reliable ways to judge whether leading developers' safety and security claims are accurate and whether their practices meet relevant standards. Compared to other social and technological systems we rely on daily such as consumer products, corporate financial statements, and food supply chains, AI is subject to less rigorous third-party scrutiny along several dimensions. Ambiguity about whether AI systems are trustworthy can discourage deployment in some contexts where the technology could be beneficial, and make it more likely when it's dangerous. Public transparency alone cannot close this gap: many safety- and security-relevant details are legitimately confidential and require expert interpretation. We define frontier AI auditing as rigorous third-party verification of frontier AI developers' safety and security claims, and evaluation of their systems and practices against relevant standards, based on deep, secure access to non-public information. To make rigor legible and comparable, we introduce AI Assurance Levels (AAL-1 to AAL-4), ranging from time-bounded system audits to continuous, deception-resilient verification.


翻译:前沿人工智能正日益成为关键的社会基础设施,但外部人员缺乏可靠的方法来判断领先开发者的安全与安全声明是否准确,以及其实践是否符合相关标准。与我们日常依赖的其他社会和技术系统(如消费品、企业财务报表和食品供应链)相比,人工智能在多个维度上受到的第三方审查更为宽松。人工智能系统是否值得信赖的不确定性,可能会阻碍该技术在部分本可受益的领域得到部署,同时增加其在危险情境下被应用的可能性。仅靠公开透明度无法弥合这一差距:许多与安全和安全相关的细节具有合理的保密性,且需要专家解读。我们将前沿人工智能审计定义为:基于对非公开信息的深入、安全访问,对前沿人工智能开发者的安全与安全声明进行严格的第三方验证,并依据相关标准评估其系统与实践。为使严格性清晰可辨且具有可比性,我们引入了人工智能保障等级(AAL-1至AAL-4),其范围涵盖有时限的系统审计到持续且具备抗欺骗能力的验证。

0
下载
关闭预览

相关内容

前沿人工智能趋势报告(Frontier AI Trends Report)
专知会员服务
37+阅读 · 2025年12月20日
国家标准《人工智能风险管理能力评估》(征求意见稿)
2024 人工智能安全报告
专知会员服务
83+阅读 · 2024年3月8日
人工智能安全挑战及治理研究
专知会员服务
67+阅读 · 2023年6月18日
专知会员服务
63+阅读 · 2021年7月5日
《人工智能安全测评白皮书》,99页pdf
专知
36+阅读 · 2022年2月26日
边缘智能发展与演进白皮书
物联网智库
13+阅读 · 2019年6月17日
人工智能对网络空间安全的影响
走向智能论坛
21+阅读 · 2018年6月7日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月19日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员