本报告描述了Draper团队作为DARPA能力感知机器学习(CAML)项目的一部分,根据HR0011-20-C-0032号合同所开展的研究。Draper与分包商UT Austin、ASU和CU Boulder合作,开发了ALPACA(能力感知的概率和抽象自主学习),这是一个能力感知自主智能体的一般框架,特别是那些基于强化学习(RL)的智能体。ALPACA提供了对RL智能体能力的洞察力,并使用户能够检查和约束智能体行为,促进与人类队友建立信任,并极大地提高现实世界应用的安全性。

一个支持ALPACA的自主智能体可以:

  • 用自然语言交流其任务策略和预期性能
  • 识别影响其行为的(可观察和隐藏的)条件
  • 评估其在特定情况下的行为和任务结果
  • 量化其信心,包括对其任务表现和能力评估的信心
  • 当它的能力发生变化或可能突破能力界限时,更新用户。
  • 调整其行为以更好地保持性能并符合用户期望

ALPACA通过两种方式进行能力交流:

1.一般能力声明描述了以前观察到的智能体的策略、性能和行为状况。

2.具体的能力评估预测智能体在特定场景下的策略和表现,包括任务前和在线的情况。这些评估对用户的兴趣有反应,可以解决新的场景,并且可以在线更新。

为了实现DARPA CAML计划的目标,Draper ALPACA团队开发了以下关键技术进展:

  • 通过对程序生成的人类可理解的特征(包括直接观察到的和隐藏的)进行决策树学习,进行条件识别。实现了DARPA的覆盖要求。
  • 基于在抽象和分割的轨迹数据上推断的时间逻辑的结构化语言策略。达到DARPA的正确性要求。
  • 基于递归深度生成模型的概率世界模型(PWMs),能够准确预测长时间范围内的代理状态,同时量化无误差和认识性不确定性。实现了DARPA的保真度要求。
  • 事件触发的在线结果评估,利用PWM来实时评估和重新评估智能体在特定场景中的能力。实现了DARPA的可靠性要求。

Draper ALPACA团队在两个基于模拟的RL应用系统上研究、演示和评估了这些进展:推土机机器人操纵任务和多变天气下的无人机飞行任务。内部和第三方的核查和验证表明,该团队能够实现DARPA为CAML项目制定的所有目标指标。

成为VIP会员查看完整内容
68

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《嵌入式深度学习和高级计算》美空军2023最新报告
专知会员服务
58+阅读 · 2023年7月27日
MIT最新《贝叶斯深度学习》综述论文,37页pdf
专知会员服务
55+阅读 · 2021年1月4日
万字长文概述NLP中的深度学习技术
全球人工智能
12+阅读 · 2019年2月28日
实战 | 基于深度学习模型VGG的图像识别(附代码)
七月在线实验室
13+阅读 · 2018年3月30日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
83+阅读 · 2023年3月26日
VIP会员
最新内容
AutoScientists:自组织智能体团队驱动长期科学实验
战略前沿人工智能的再思考(中文)
专知会员服务
2+阅读 · 今天14:53
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
2+阅读 · 今天14:51
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
2+阅读 · 今天14:38
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
Agent Harness综述:大模型智能体执行器工程全景
专知会员服务
13+阅读 · 5月28日
《基于理论的威慑效能评估》
专知会员服务
8+阅读 · 5月28日
相关VIP内容
《嵌入式深度学习和高级计算》美空军2023最新报告
专知会员服务
58+阅读 · 2023年7月27日
MIT最新《贝叶斯深度学习》综述论文,37页pdf
专知会员服务
55+阅读 · 2021年1月4日
相关资讯
万字长文概述NLP中的深度学习技术
全球人工智能
12+阅读 · 2019年2月28日
实战 | 基于深度学习模型VGG的图像识别(附代码)
七月在线实验室
13+阅读 · 2018年3月30日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
50+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员