Evaluating Nova 2.0 Lite model under Amazon's Frontier Model Safety Framework - 专知论文

会员服务 ·

0

亚马逊 (Amazon.com) · 模型安全 · 安全框架 · 视频 · 自动化 ·

Evaluating Nova 2.0 Lite model under Amazon's Frontier Model Safety Framework

翻译：在亚马逊前沿模型安全框架下评估Nova 2.0 Lite模型

Satyapriya Krishna,Matteo Memelli,Tong Wang,Abhinav Mohanty,Claire O'Brien Rajkumar,Payal Motwani,Rahul Gupta,Spyros Matsoukas

from arxiv, Arxiv preprint

Amazon published its Frontier Model Safety Framework (FMSF) as part of the Paris AI summit, following which we presented a report on Amazon's Premier model. In this report, we present an evaluation of Nova 2.0 Lite. Nova 2.0 Lite was made generally available from amongst the Nova 2.0 series and is one of its most capable reasoning models. The model processes text, images, and video with a context length of up to 1M tokens, enabling analysis of large codebases, documents, and videos in a single prompt. We present a comprehensive evaluation of Nova 2.0 Lite's critical risk profile under the FMSF. Evaluations target three high-risk domains-Chemical, Biological, Radiological and Nuclear (CBRN), Offensive Cyber Operations, and Automated AI R&D-and combine automated benchmarks, expert red-teaming, and uplift studies to determine whether the model exceeds release thresholds. We summarize our methodology and report core findings. We will continue to enhance our safety evaluation and mitigation pipelines as new risks and capabilities associated with frontier models are identified.

翻译：亚马逊在巴黎人工智能峰会上发布了其前沿模型安全框架（FMSF），随后我们提交了一份关于亚马逊旗舰模型的报告。本报告呈现了对Nova 2.0 Lite模型的评估结果。Nova 2.0 Lite是从Nova 2.0系列中公开发布的版本，也是该系列中推理能力最强的模型之一。该模型能够处理文本、图像和视频输入，上下文长度高达100万token，支持通过单次提示分析大型代码库、文档和视频。我们在FMSF框架下对Nova 2.0 Lite的关键风险特征进行了全面评估。评估聚焦三个高风险领域——化学、生物、放射性与核武器（CBRN），进攻性网络行动，以及自动化人工智能研发——结合自动化基准测试、专家红队测试和提升研究，以判定模型是否超出发布阈值。我们总结了评估方法并报告了核心发现。随着前沿模型相关的新风险和能力被不断识别，我们将持续完善安全评估与风险缓解流程。

0

相关内容

亚马逊 (Amazon.com)

亚马逊 (Amazon.com)

亚马逊公司是一家总部位于美国西雅图的跨国电子商务企业，业务起始于线上书店，不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一，也是美国《财富》杂志2015年评选的全球最大500家公司的排行榜中的第88名。维基百科

《人工智能安全治理框架》2.0版发布，90页pdf

《人工智能安全治理框架》2.0版发布，90页pdf

专知会员服务

23+阅读 · 2025年10月8日

Gemini 2.5：推动前沿，具备先进推理、多模态、长上下文及下一代智能体能力

Gemini 2.5：推动前沿，具备先进推理、多模态、长上下文及下一代智能体能力

专知会员服务

20+阅读 · 2025年7月13日

《人工智能安全治理框架》1.0版发布

《人工智能安全治理框架》1.0版发布

专知会员服务

31+阅读 · 2024年9月9日

大模型安全性，Google DeepMind Nicholas Carlini，附191页slides与视频

大模型安全性，Google DeepMind Nicholas Carlini，附191页slides与视频

专知会员服务

31+阅读 · 2024年7月15日

《大模型安全实践（2024）》白皮书，42页pdf

《大模型安全实践（2024）》白皮书，42页pdf

专知会员服务

94+阅读 · 2024年7月10日

模型即服务MaaS框架与应用研究报告（2024年），46页pdf

模型即服务MaaS框架与应用研究报告（2024年），46页pdf

专知会员服务

66+阅读 · 2024年6月9日

Gemini 1.5突然发布，最新技术报告！总体上性能暴增，最惊艳的是支持100万Token窗口！58页pdf

Gemini 1.5突然发布，最新技术报告！总体上性能暴增，最惊艳的是支持100万Token窗口！58页pdf

专知会员服务

50+阅读 · 2024年2月18日

新加坡-生成式AI的治理框架模型，23页pdf

新加坡-生成式AI的治理框架模型，23页pdf

专知会员服务

59+阅读 · 2024年2月4日

腾讯研究院《大模型安全与伦理研究（2024）》报告

腾讯研究院《大模型安全与伦理研究（2024）》报告

专知会员服务

73+阅读 · 2024年1月31日

超越GPT-4？Google60页《Gemini-高性能多模态大模型》报告，详解技术测试等细节，附中英文版

超越GPT-4？Google60页《Gemini-高性能多模态大模型》报告，详解技术测试等细节，附中英文版

专知会员服务

175+阅读 · 2023年12月7日

精通ChatGPT等大模型，掌握最前沿技术，这有份绝佳资源

精通ChatGPT等大模型，掌握最前沿技术，这有份绝佳资源

机器之心

15+阅读 · 2023年4月12日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

94+阅读 · 2022年4月17日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AI科技评论

13+阅读 · 2020年2月5日

谷歌ALBERT模型V2+中文版来了：之前刷新NLP各大基准，现在GitHub热榜第二

谷歌ALBERT模型V2+中文版来了：之前刷新NLP各大基准，现在GitHub热榜第二

量子位

14+阅读 · 2020年1月2日

华为诺亚方舟预训练语言模型NEZHA、TinyBERT开源代码

华为诺亚方舟预训练语言模型NEZHA、TinyBERT开源代码

专知

17+阅读 · 2019年12月7日

今晚，华为诺亚方舟NeurIPS 2019论文分享：基于少量数据的神经网络模型压缩技术

今晚，华为诺亚方舟NeurIPS 2019论文分享：基于少量数据的神经网络模型压缩技术

机器之心

11+阅读 · 2019年11月21日

与 TensorFlow 功能互补的腾讯 angel 发布 3.0 ：高效处理千亿级别模型

与 TensorFlow 功能互补的腾讯 angel 发布 3.0 ：高效处理千亿级别模型

AI科技评论

11+阅读 · 2019年8月28日

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

专知

28+阅读 · 2019年1月27日

动态重构综合模块化航空电子系统适航安全性评估方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向“海上丝绸之路”的南海航线安全评价智能体模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

云计算环境信任链系统安全性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向CCMANET网络可证明安全命名与名字路由机制关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

Llama-3.1-FoundationAI-SecurityLLM-Reasoning-8B Technical Report

Arxiv

0+阅读 · 1月28日

Benchmarking LLAMA Model Security Against OWASP Top 10 For LLM Applications

Arxiv

0+阅读 · 1月27日

Modular Foundation Model Inference at the Edge: Network-Aware Microservice Optimization

Arxiv

0+阅读 · 1月27日

PrivTune: Efficient and Privacy-Preserving Fine-Tuning of Large Language Models via Device-Cloud Collaboration

Arxiv

0+阅读 · 1月21日

A Safety Report on GPT-5.2, Gemini 3 Pro, Qwen3-VL, Grok 4.1 Fast, Nano Banana Pro, and Seedream 4.5

Arxiv

0+阅读 · 1月16日

SafePro: Evaluating the Safety of Professional-Level AI Agents

Arxiv

0+阅读 · 1月13日

Safe Vision-Language Models via Unsafe Weights Manipulation

Arxiv

0+阅读 · 1月12日

PII-VisBench: Evaluating Personally Identifiable Information Safety in Vision Language Models Along a Continuum of Visibility

Arxiv

0+阅读 · 1月9日

Larger Scale Offers Better Security in the Nakamoto-style Blockchain

Arxiv

0+阅读 · 1月5日

LLM-Powered Analysis of IoT User Reviews: Tracking and Ranking Security and Privacy Concerns

Arxiv

0+阅读 · 1月1日

VIP会员

文章信息

相关主题

亚马逊 (Amazon.com)

最新内容

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

专知会员服务

0+阅读 · 今天14:48

博士论文 | 从算法到基础模型：强化学习的统一视角

博士论文 | 从算法到基础模型：强化学习的统一视角

专知会员服务

0+阅读 · 今天14:46

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

4+阅读 · 今天8:04

《异构人类团队的协作决策过程混合建模研究》

《异构人类团队的协作决策过程混合建模研究》

专知会员服务

4+阅读 · 今天7:59

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

专知会员服务

4+阅读 · 今天7:56

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

专知会员服务

4+阅读 · 今天7:50

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

4+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

6+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

13+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

7+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

7+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

5+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

11+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

7+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

10+阅读 · 7月26日

相关VIP内容

《人工智能安全治理框架》2.0版发布，90页pdf

《人工智能安全治理框架》2.0版发布，90页pdf

专知会员服务

23+阅读 · 2025年10月8日

Gemini 2.5：推动前沿，具备先进推理、多模态、长上下文及下一代智能体能力

Gemini 2.5：推动前沿，具备先进推理、多模态、长上下文及下一代智能体能力

专知会员服务

20+阅读 · 2025年7月13日

《人工智能安全治理框架》1.0版发布

《人工智能安全治理框架》1.0版发布

专知会员服务

31+阅读 · 2024年9月9日

大模型安全性，Google DeepMind Nicholas Carlini，附191页slides与视频

大模型安全性，Google DeepMind Nicholas Carlini，附191页slides与视频

专知会员服务

31+阅读 · 2024年7月15日

《大模型安全实践（2024）》白皮书，42页pdf

《大模型安全实践（2024）》白皮书，42页pdf

专知会员服务

94+阅读 · 2024年7月10日

模型即服务MaaS框架与应用研究报告（2024年），46页pdf

模型即服务MaaS框架与应用研究报告（2024年），46页pdf

专知会员服务

66+阅读 · 2024年6月9日

Gemini 1.5突然发布，最新技术报告！总体上性能暴增，最惊艳的是支持100万Token窗口！58页pdf

Gemini 1.5突然发布，最新技术报告！总体上性能暴增，最惊艳的是支持100万Token窗口！58页pdf

专知会员服务

50+阅读 · 2024年2月18日

新加坡-生成式AI的治理框架模型，23页pdf

新加坡-生成式AI的治理框架模型，23页pdf

专知会员服务

59+阅读 · 2024年2月4日

腾讯研究院《大模型安全与伦理研究（2024）》报告

腾讯研究院《大模型安全与伦理研究（2024）》报告

专知会员服务

73+阅读 · 2024年1月31日

超越GPT-4？Google60页《Gemini-高性能多模态大模型》报告，详解技术测试等细节，附中英文版

超越GPT-4？Google60页《Gemini-高性能多模态大模型》报告，详解技术测试等细节，附中英文版

专知会员服务

175+阅读 · 2023年12月7日

热门VIP内容

开通专知VIP会员享更多权益服务

博士论文 | 从算法到基础模型：强化学习的统一视角

《异构人类团队的协作决策过程混合建模研究》

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

面向国防作战的最佳自主与蜂群无人机技术

相关资讯

精通ChatGPT等大模型，掌握最前沿技术，这有份绝佳资源

精通ChatGPT等大模型，掌握最前沿技术，这有份绝佳资源

机器之心

15+阅读 · 2023年4月12日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

94+阅读 · 2022年4月17日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AI科技评论

13+阅读 · 2020年2月5日

谷歌ALBERT模型V2+中文版来了：之前刷新NLP各大基准，现在GitHub热榜第二

谷歌ALBERT模型V2+中文版来了：之前刷新NLP各大基准，现在GitHub热榜第二

量子位

14+阅读 · 2020年1月2日

华为诺亚方舟预训练语言模型NEZHA、TinyBERT开源代码

华为诺亚方舟预训练语言模型NEZHA、TinyBERT开源代码

专知

17+阅读 · 2019年12月7日

今晚，华为诺亚方舟NeurIPS 2019论文分享：基于少量数据的神经网络模型压缩技术

今晚，华为诺亚方舟NeurIPS 2019论文分享：基于少量数据的神经网络模型压缩技术

机器之心

11+阅读 · 2019年11月21日

与 TensorFlow 功能互补的腾讯 angel 发布 3.0 ：高效处理千亿级别模型

与 TensorFlow 功能互补的腾讯 angel 发布 3.0 ：高效处理千亿级别模型

AI科技评论

11+阅读 · 2019年8月28日

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

AAAI2019教程抢先看！《深度贝叶斯与序列学习》，279页PPT带你知晓深度贝叶斯序列模型在NLP最新进展

专知

28+阅读 · 2019年1月27日

相关论文

Llama-3.1-FoundationAI-SecurityLLM-Reasoning-8B Technical Report

Arxiv

0+阅读 · 1月28日

Benchmarking LLAMA Model Security Against OWASP Top 10 For LLM Applications

Arxiv

0+阅读 · 1月27日

Modular Foundation Model Inference at the Edge: Network-Aware Microservice Optimization

Arxiv

0+阅读 · 1月27日

PrivTune: Efficient and Privacy-Preserving Fine-Tuning of Large Language Models via Device-Cloud Collaboration

Arxiv

0+阅读 · 1月21日

A Safety Report on GPT-5.2, Gemini 3 Pro, Qwen3-VL, Grok 4.1 Fast, Nano Banana Pro, and Seedream 4.5

Arxiv

0+阅读 · 1月16日

SafePro: Evaluating the Safety of Professional-Level AI Agents

Arxiv

0+阅读 · 1月13日

Safe Vision-Language Models via Unsafe Weights Manipulation

Arxiv

0+阅读 · 1月12日

PII-VisBench: Evaluating Personally Identifiable Information Safety in Vision Language Models Along a Continuum of Visibility

Arxiv

0+阅读 · 1月9日

Larger Scale Offers Better Security in the Nakamoto-style Blockchain

Arxiv

0+阅读 · 1月5日

LLM-Powered Analysis of IoT User Reviews: Tracking and Ranking Security and Privacy Concerns

Arxiv

0+阅读 · 1月1日

相关基金

动态重构综合模块化航空电子系统适航安全性评估方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向“海上丝绸之路”的南海航线安全评价智能体模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

云计算环境信任链系统安全性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向CCMANET网络可证明安全命名与名字路由机制关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员