人工智能能力T&E 战略

本文件是人工智能能力测试与评估框架的一部分

CDAO 评估和保证部门正在创建一个框架,为如何测试和评估(T&E)人工智能能力(AIECs)提供指导。

CDAO 的 AIEC 测试与评估框架分为四个重点领域

虽然这些测试与评估重点领域有助于将测试与评估的关键环节分解成易于消化的部分,但在实际测试中,它们既不相互排斥,也没有明确的界限。

CDAO 正在开发一系列产品,以满足关键的测试与评估需求

第 1 部分旨在帮助测试人员了解测试和评估的核心概念,以便工作级别的测试人员能够编写和评估人工智能能力的测试和评估战略

什么是测试与评估战略?

美国防部采购中指导测试计划和执行的高级文件。

成为VIP会员查看完整内容
42

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《为美国防部和北约的 5G 制定敏捷标准流程》13页slides
专知会员服务
18+阅读 · 2025年1月18日
《利用人工智能 (AI) 实现决策优势》13页slides
专知会员服务
56+阅读 · 2024年5月2日
《军事行动自动化》【译文】2022最新报告
专知
67+阅读 · 2022年11月13日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
51+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2013年12月31日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
182+阅读 · 2023年3月24日
Arxiv
27+阅读 · 2023年3月17日
VIP会员
最新内容
战略前沿人工智能的再思考(中文)
专知会员服务
4+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
4+阅读 · 5月29日
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
4+阅读 · 5月29日
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
14+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
51+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员