数据耕耘法是一种基于仿真的方法,应用于国防领域,用于分析复杂系统并为决策者提供洞见。它可以产生非常庞大的多维数据集,需要借助元建模等复杂分析工具。可解释人工智能的进展扩展了可考虑的元模型类型;然而,构建一个拟合良好的机器学习元模型涉及许多任务,这可能对分析师来说非常耗时。自动机器学习可以通过自动化元模型的训练、调优和测试来为分析师节省时间。我们利用一个军事地面防空场景的基于代理仿真输出,比较了使用自动机器学习与不同实验设计所训练的元模型的性能。我们发现,自动机器学习可以合理地自动化元模型的构建,并通过考虑多种元模型类型为分析增加了稳健性;然而,实验设计的类型和规模会显著影响元模型的性能。

国防领域内的决策者通常需要理解涉及大量不确定因素的复杂系统(Horne等人,2018年)。对这些复杂系统进行现实世界实验并非总是可行;例如,在采购过程中,为测试目的获取所有备选方案可能成本过高。在其他情况下,决策可能涉及尚未开发或部署的系统。仿真模型可以帮助分析师和决策者形成对系统的基本理解、发现稳健的选项,并比较这些选项的可能结果(Kleijnen等人,2005年)。

数据耕耘法是在国防领域内开发的一种方法,旨在通过运行大规模、高效设计的仿真实验,增进对决策者面临的多种可能性的理解(Horne等人,2018年)。它是一个协作且迭代的过程,包含五个基本组成部分:快速想定原型构建、模型开发、实验设计、高性能计算以及分析与可视化;关于数据耕耘法方法的详细信息可参见Horne等人(2014年),而对当前数据耕耘能力的最新概述可参见Sanchez(2020年)。数据耕耘过程能生成大量的多维数据,需要借助复杂的分析技术来突显有用信息、提取结论并支持决策(Horne等人,2014年)。通常,需要多种技术来充分挖掘数据价值(Horne等人,2014年;Sanchez,2020年),包括构建元模型。如Kleijnen和Sargent(2000年)所定义,“元模型是对仿真模型所蕴含的输入/输出变换的一种近似”。元模型很有用,因为它们可以促进理解(Sanchez,2020年);例如,元模型的功能形式(如低阶多项式模型)可以提供关于仿真输出如何随仿真输入变化(如以线性或非线性方式)的洞见。元模型还有助于评估哪些仿真输入是仿真输出的关键驱动因素(Sanchez,2020年)。 过去军事数据耕耘应用中常见的元模型例子包括多项式回归模型、逻辑回归模型和决策树(Kleijnen等人,2005年;Lucas等人,2007年;Kallfass和Schlaak,2012年;Sanchez和Wan,2015年;Hill等人,2019年;Kesler等人,2019年)。这些类型的模型通常被描述为可解释或白盒模型:可以研究其输入/输出关系的内部映射,进而用于推断有关被建模系统的知识(Feldkamp等人,2020年;Feldkamp,2021年)。许多机器学习模型,如深度学习或集成模型,通常被描述为黑盒模型。研究已表明它们能比白盒模型实现更高的预测精度,从而在可解释性和准确性之间产生了权衡(Lundberg和Lee,2017年)。针对这种权衡,可解释人工智能领域应运而生,催生了旨在使黑盒模型透明化的方法(Feldkamp,2021年)。XAI包含广泛的方法,一些例子包括排列特征重要性和SHAP(Feldkamp,2021年)。这些方法在数据耕耘背景下的近期军事应用可参见Amyot-Bourgeois等人(2021年)和Serré等人(2021年)。Feldkamp(2021年)提出了一个将XAI方法纳入数据耕耘过程输出分析的工作流程。

如Feldkamp(2021年)所述,将机器学习模型与XAI方法结合应用,为构建和解释耕耘数据的元模型开辟了全新的技术范围。构建机器学习模型涉及许多任务,例如选择模型类型或模型族、调整模型超参数以及评估模型性能。这可能成为一个耗时的过程,尤其是在像数据耕耘这样的迭代过程中,随着实验的进行和演变,可能会生成一系列数据集。自动机器学习指的是自动化部分或全部机器学习任务的工具,旨在使机器学习实践更加系统化和高效化(Ghahramani,2019年)。自动机器学习工具的开源示例包括Auto-Sklearn(Feurer等人,2021年)、H2O AutoML(LeDell和Poirier,2020年)以及基于树的流水线优化工具(Le等人,2020年)。

自动机器学习为进一步扩展可用于输出分析的工具集提供了机会,并能在数据耕耘中实现可解释人工智能方面发挥关键作用。然而,在数据耕耘过程中构建元模型时,还必须考虑实验设计。这被描述为一个“先有鸡还是先有蛋”的问题(Kleijnen等人,2005年):所考虑的元模型类型取决于实验设计,反之亦然。虽然文献中提供了为白盒元模型选择合适的实验设计的指导,但针对黑盒元模型的指导似乎较少。因此,本文的目标是双重的。首先,它寻求通过自动机器学习提高元模型构建的效率。其次,它通过进行一个多模型、多设计的比较,同时也考虑实验设计中重复次数与覆盖范围之间的权衡,为选择黑盒元模型的实验设计提供指导。

成为VIP会员查看完整内容
1

相关内容

军事防务数据板块介绍:系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块,其核心在于整合全球新兴国防技术(军事人工智能、无人系统等)、热点案例(俄乌战争、美以伊战争)等方面的最新时讯、研究报告/论文、条令法规、案例分析,为战略研判、情报分析、决策支持等提供知识支撑。
《运用深度学习增强军事仿真:一种综合性方法》
专知会员服务
29+阅读 · 2025年10月2日
《机器学习为军事战术行动提供安全保障 》
专知会员服务
24+阅读 · 2024年8月8日
《自适应自动化兵力生成的机器学习趋势》美国陆军
专知会员服务
46+阅读 · 2023年3月6日
【AI与军事】机器学习的军事应用
专知会员服务
215+阅读 · 2022年4月25日
深度学习研究及军事应用综述
专知
29+阅读 · 2022年7月7日
综述:军事应用中使用的一些重要算法
专知
13+阅读 · 2022年7月3日
基于深度学习的数据融合方法研究综述
专知
37+阅读 · 2020年12月10日
概述自动机器学习(AutoML)
人工智能学家
19+阅读 · 2019年8月11日
国家自然科学基金
338+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
14+阅读 · 2008年12月31日
Arxiv
95+阅读 · 2022年8月2日
VIP会员
最新内容
马赛克战:俄乌战场透析
专知会员服务
1+阅读 · 今天4:12
《利用人工智能增强军事决策》
专知会员服务
0+阅读 · 今天4:09
《自动机器学习在军事数据耕耘法中的应用》
专知会员服务
1+阅读 · 今天4:02
为何指挥所生存能力要求范式转变
专知会员服务
0+阅读 · 今天3:54
打造“新蛛网”模式与高科技动员
专知会员服务
0+阅读 · 今天3:33
“蛛网”行动一周年:远程无人机战争
专知会员服务
0+阅读 · 今天3:23
【剑桥博士论文】智能体-环境协同优化
专知会员服务
5+阅读 · 6月9日
为初级军官战术训练设计生成式人工智能平台
专知会员服务
8+阅读 · 6月9日
《美军条令:作战伤员后送保障》
专知会员服务
6+阅读 · 6月9日
相关基金
国家自然科学基金
338+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
14+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员