DARPA D3M计划《发现和收集数据以支持数据分析》 - 专知VIP

会员服务 ·

14

军事防务 · DARPA · 数据分析 · 数据集 · 美国空军研究实验室（AFRL） ·

2024 年 5 月 18 日

DARPA D3M计划《发现和收集数据以支持数据分析》

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在 D3M 计划下，本研究以在 DARPA Memex 计划下开发的技术为基础，开发了一系列领域发现 (DD)、数据收集和提取工具。

在 D3M 计划启动之初，最先进的领域发现系统仍然面临着许多挑战，其中许多挑战是在 Memex 计划工作期间遇到的。例如，在 Memex 项目下开发的系统中，没有一个能在项目评估中针对地面实况数据集持续达到可接受的召回率。虽然精确度得分略有提高，但仍有很大的改进空间，这就需要解决从底层网络爬行技术中继承下来的一系列难题，如动态内容的可靠处理、验证码谜题等反僵尸机制，以及软 404 错误、停放域名和页面加载延迟等其他令人烦恼的问题。

我们在 D3M 项目下提出的工作目标是结合并扩展一系列现有功能，以提供一个易于重新训练、与模型无关的数据发现、收集和提取系统，该系统可以集中提供并在多个项目中使用。

我们的计划是将我们的技术集成到由 D3M 计划中至少另外两个团队正在开发的 DataMart 系统中。DataMart 为特定领域的数据集编制索引，这些数据集由领域发现爬网程序整理，并通过复杂的 ETL 管道摄取到索引中，这些管道可提取元数据，并识别领域内和跨领域的不同数据集之间的潜在连接和联合。根据我们在 Memex 计划中积累的经验和现有的工具套件，我们提议建立后台发现爬虫，DataMart 系统可利用这些爬虫填充其索引。然而，由于长达一年的合同延迟，我们在项目启动一年后才加入，因此 DataMart 团队早已进入研究阶段，而我们却在努力寻找整合与合作的机会。整合需要 DataMart 团队进行额外的、有时是追溯性的工作，虽然每个人都有最好的合作意愿，但最终证明这在技术上是不可行的。我们确实完成了数据集发现系统与纽约大学和 ISI Datamart 系统的概念验证集成，但我们没有继续进行端到端测试。

尽管如此，仍继续专注于构建离散领域发现工具和实用程序，供 DataMart 系统、其他执行者或潜在的过渡合作伙伴使用。我们继续与 DARPA 合作，以确定我们可以帮助解决的计划能力组合中的差距，并继续寻找机会，以应对领域发现和数据集 ETL 领域中的新用例和挑战问题。

成为VIP会员查看完整内容

38

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

《基于专家衍生决策策略的增强自主智能体》

《基于专家衍生决策策略的增强自主智能体》

专知会员服务

50+阅读 · 2024年6月5日

大型语言模型自动程序修复的系统文献综述

大型语言模型自动程序修复的系统文献综述

专知会员服务

43+阅读 · 2024年5月5日

《大型语言模型持续学习》综述

《大型语言模型持续学习》综述

专知会员服务

93+阅读 · 2024年4月26日

大型语言模型图表示学习：技术的全面综述

大型语言模型图表示学习：技术的全面综述

专知会员服务

53+阅读 · 2024年2月14日

DARPA "少标签学习 "项目《利用任务和领域结构从小型标签集学习》2023最新报告

DARPA "少标签学习 "项目《利用任务和领域结构从小型标签集学习》2023最新报告

专知会员服务

57+阅读 · 2023年12月6日

《在开放世界的新奇场景中测试人工智能学习（TALONS）》美国国防部高级研究计划局（DARPA）2023最新 312页报告

《在开放世界的新奇场景中测试人工智能学习（TALONS）》美国国防部高级研究计划局（DARPA）2023最新 312页报告

专知会员服务

73+阅读 · 2023年11月28日

《量子机器学习》最新综述

《量子机器学习》最新综述

专知会员服务

40+阅读 · 2023年8月24日

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

专知会员服务

33+阅读 · 2023年3月25日

【CVPR2021】深度学习细粒度视觉分析

【CVPR2021】深度学习细粒度视觉分析

专知会员服务

36+阅读 · 2021年6月23日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知会员服务

108+阅读 · 2020年10月9日

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

63+阅读 · 2023年4月5日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

专知

28+阅读 · 2022年7月14日

时空数据挖掘:综述

时空数据挖掘:综述

专知

36+阅读 · 2022年6月30日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

万字长文概述NLP中的深度学习技术

万字长文概述NLP中的深度学习技术

全球人工智能

12+阅读 · 2019年2月28日

大数据分析研究组开源Easy Machine Learning系统

大数据分析研究组开源Easy Machine Learning系统

中国科学院网络数据重点实验室

17+阅读 · 2017年6月13日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂疾病的全基因组SNP互作网络构建与分析

国家自然科学基金

0+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

47+阅读 · 2015年12月31日

协同特征CAD中支持多用户意图融合的关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

自检测型量子密钥分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于集成流形学习的监控视频中人体行为识别研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

DLP: towards active defense against backdoor attacks with decoupled learning process

Arxiv

0+阅读 · 2024年6月18日

On GNN explanability with activation rules

Arxiv

0+阅读 · 2024年6月17日

A framework for optimisation based stochastic process discovery

Arxiv

0+阅读 · 2024年6月16日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

176+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

111+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

232+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

27+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

28+阅读 · 2023年1月13日

VIP会员

相关主题

美国空军研究实验室（AFRL）

最新内容

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

3+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

4+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

3+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

1+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

4+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

1+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

2+阅读 · 7月17日

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

11+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

13+阅读 · 7月16日

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

13+阅读 · 7月16日

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

9+阅读 · 7月16日

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

15+阅读 · 7月16日

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

13+阅读 · 7月15日

相关VIP内容

《基于专家衍生决策策略的增强自主智能体》

《基于专家衍生决策策略的增强自主智能体》

专知会员服务

50+阅读 · 2024年6月5日

大型语言模型自动程序修复的系统文献综述

大型语言模型自动程序修复的系统文献综述

专知会员服务

43+阅读 · 2024年5月5日

《大型语言模型持续学习》综述

《大型语言模型持续学习》综述

专知会员服务

93+阅读 · 2024年4月26日

大型语言模型图表示学习：技术的全面综述

大型语言模型图表示学习：技术的全面综述

专知会员服务

53+阅读 · 2024年2月14日

DARPA "少标签学习 "项目《利用任务和领域结构从小型标签集学习》2023最新报告

DARPA "少标签学习 "项目《利用任务和领域结构从小型标签集学习》2023最新报告

专知会员服务

57+阅读 · 2023年12月6日

《在开放世界的新奇场景中测试人工智能学习（TALONS）》美国国防部高级研究计划局（DARPA）2023最新 312页报告

《在开放世界的新奇场景中测试人工智能学习（TALONS）》美国国防部高级研究计划局（DARPA）2023最新 312页报告

专知会员服务

73+阅读 · 2023年11月28日

《量子机器学习》最新综述

《量子机器学习》最新综述

专知会员服务

40+阅读 · 2023年8月24日

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

《通过端到端学习和用户交互的复杂管道自动合成》美国空军研究实验室39页报告

专知会员服务

33+阅读 · 2023年3月25日

【CVPR2021】深度学习细粒度视觉分析

【CVPR2021】深度学习细粒度视觉分析

专知会员服务

36+阅读 · 2021年6月23日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知会员服务

108+阅读 · 2020年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

《边缘端实时无线感知赋能现场多机器人部署》200页

人工智能赋能战场情报：提速决策进程

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

战力倍增器：自主武器系统与乌克兰及加沙冲突

相关资讯

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

【2023新书】AI4Science，人工智能促进科学发现，134页pdf

专知

63+阅读 · 2023年4月5日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

【2022新书】联邦学习：方法和应用的综合概述，531页pdf

专知

28+阅读 · 2022年7月14日

时空数据挖掘:综述

时空数据挖掘:综述

专知

36+阅读 · 2022年6月30日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

万字长文概述NLP中的深度学习技术

万字长文概述NLP中的深度学习技术

全球人工智能

12+阅读 · 2019年2月28日

大数据分析研究组开源Easy Machine Learning系统

大数据分析研究组开源Easy Machine Learning系统

中国科学院网络数据重点实验室

17+阅读 · 2017年6月13日

相关基金

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂疾病的全基因组SNP互作网络构建与分析

国家自然科学基金

0+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

47+阅读 · 2015年12月31日

协同特征CAD中支持多用户意图融合的关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

自检测型量子密钥分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于集成流形学习的监控视频中人体行为识别研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

相关论文

DLP: towards active defense against backdoor attacks with decoupled learning process

Arxiv

0+阅读 · 2024年6月18日

On GNN explanability with activation rules

Arxiv

0+阅读 · 2024年6月17日

A framework for optimisation based stochastic process discovery

Arxiv

0+阅读 · 2024年6月16日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

176+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

111+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

232+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

27+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

28+阅读 · 2023年1月13日

微信扫码咨询专知VIP会员