Frontier AI systems are being adopted across Africa, yet most AI safety evaluations are designed and validated in Western environments. In this paper, we argue that the portability gap can leave Africa-centric pathways to severe harm untested when frontier AI systems are embedded in materially constrained and interdependent infrastructures. We define severe AI risks as material risks from frontier AI systems that result in critical harm, measured as the grave injury or death of thousands of people or economic loss and damage equivalent to five percent of a country's GDP. To support AI safety evaluation design, we develop a taxonomy for identifying Africa-centric severe AI risks. The taxonomy links outcome thresholds to process pathways that model risk as the intersection of hazard, vulnerability, and exposure. We distinguish severe risks by amplification and suddenness, where amplification requires that frontier AI be a necessary magnifier of latent danger and suddenness captures harms that materialise rapidly enough to overwhelm ordinary coping and governance capacity. We then propose threat modelling strategies for African contexts, surveying reference class forecasting, structured expert elicitation, scenario planning, and system theoretic process analysis, and tailoring them to constraints of limited resources, poor connectivity, limited technical expertise, weak state capacity, and conflict. We also examine AI misalignment risk, concluding that Africa is more likely to expose universal failure modes through distributional shift than to generate distinct pathways of misalignment. Finally, we offer practical guidance for running evaluations under resource constraints, emphasising open and extensible tooling, tiered evaluation pipelines, and sharing methods and findings to broaden evaluation scope.


翻译:前沿人工智能系统正在非洲各地得到应用,但大多数人工智能安全评估都是在西方环境中设计和验证的。在本文中,我们认为可移植性差距可能导致前沿人工智能系统嵌入在物质受限且相互依赖的基础设施中时,以非洲为中心的严重危害路径未经测试。我们将严重人工智能风险定义为来源于前沿人工智能系统、导致关键性危害的物质风险,其衡量标准为数千人重伤或死亡,或相当于国家国内生产总值百分之五的经济损失和损害。为支持人工智能安全评估设计,我们开发了一个用于识别以非洲为中心的严重人工智能风险的分类法。该分类法将结果阈值与过程路径联系起来,将风险建模为危害、脆弱性和暴露的交集。我们通过放大性和突发性来区分严重风险,其中放大性要求前沿人工智能成为潜在危险的必要放大因素,而突发性则捕捉那些快速显现以至于超出常规应对和治理能力的危害。随后,我们针对非洲背景提出了威胁建模策略,考察了参考类预测、结构化专家启发、情景规划和系统理论过程分析,并将其定制以适应资源有限、连接性差、技术专长有限、国家能力薄弱和冲突等约束条件。我们还考察了人工智能失调风险,得出结论认为,与产生独特的失调路径相比,非洲更有可能通过分布偏移暴露普遍的失效模式。最后,我们提供了在资源限制下进行评估的实用指导,强调了开放和可扩展的工具、分层评估流程,以及共享方法和发现以扩大评估范围。

0
下载
关闭预览

相关内容

前沿人工智能趋势报告(Frontier AI Trends Report)
专知会员服务
39+阅读 · 2025年12月20日
《强大人工智能世界中维护安全:未来国防架构的考量》
专知会员服务
19+阅读 · 2025年11月28日
国家标准《人工智能风险管理能力评估》(征求意见稿)
《人工智能灾难性风险概述》2023最新55页报告
专知会员服务
70+阅读 · 2023年10月6日
专知会员服务
64+阅读 · 2021年7月5日
《人工智能安全测评白皮书》,99页pdf
专知
36+阅读 · 2022年2月26日
人工智能对网络空间安全的影响
走向智能论坛
21+阅读 · 2018年6月7日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月1日
VIP会员
最新内容
重新思考无人机时代的生存能力
专知会员服务
3+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
3+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
4+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
4+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
5+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员