概念阐述:帕兰蒂尔公司Maven智能系统
在其2025年出版的著作《人工智能、自动化与战争》中,安东尼·金敦促读者将人工智能理解为一个与组织结构最密切相关的现象。他直率地指出:
“我们认识和试图理解这个军事-技术复合体至关重要,尤其是因为……大量文献将人工智能神化为一种技术,而忽视了其组织层面的维度。”
人们若忽视一项技术所嵌入的结构,将自担风险。
关于美国国防部在伊朗利用人工智能进行目标获取的评论,恰恰固于对底层技术原始能力的痴迷。这种做法是以牺牲对技术与组织结构相结合的理解为代价的。
与此同时,许多评论假设Anthropic公司的“克劳德”大语言模型是美国在伊朗目标获取的主要驱动力。这似乎是错误的,尽管并非全无现实依据。更重要的系统是“克劳德”被集成其中的帕兰蒂尔公司Maven智能系统。将这套系统简单地设想为“人工智能瞄准系统”并非最佳理解。
下文将回顾事实,并总结其对国防分析人士和美国防务承包商的启示:尽管战略目标重要,但国防部采纳关键技术的游戏规则核心在于速度。这并非暗示战略与可靠性不再受关注——美国的目标获取与选择仍是复杂的过程——而是部署速度可能会压倒验证相关数据的能力。 正如前文所讨论的,这应被理解为与国防部领导层希望保持对此类技术最大限度作战接入的意愿相伴而生。
在大量报道称Anthropic公司的“克劳德”在美国执行抓捕委内瑞拉总统尼古拉斯·马杜罗的任务之前和期间被使用,以及Anthropic与国防部的争端以其被指定为供应链风险告终之后不久,美国与以色列于2月28日开始对伊朗进行打击。(关于此项供应链风险指定正在进行诉讼,一位联邦法官于3月26日暂时禁止五角大楼援引该指定——尽管该裁决几乎肯定会被上诉。更详细信息,参见此处和此处。)
有报道称“克劳德”正在被使用并产生显著效果。相关新闻呈现两种形式。
首先,《华盛顿邮报》等媒体报导称,“人工智能工具正在帮助以先前不可能达到的速度收集情报、挑选目标、规划轰炸任务和评估战斗损害。”
其次,关于“人工智能瞄准”的谈论与伊朗发生的一起瞄准失误事件相关联。在最初的美以联合打击中,一枚“战斧”导弹——美国制造的导弹——击中了位于伊朗南部城市米纳布的伊朗沙贾雷·塔耶贝女子学校。造成至少175人死亡。
《伍斯特周报》报道称,“人工智能的部署”导致了此次打击,重点在于国防部为“许多核心作战决策”而加速应用的“基于克劳德的系统”。据称,使用了关于该学校位置的“较旧的存档情报”可能是导致失误的一个原因。据报道国防部已启动内部调查。
(关于该系统作用的此种描述,就“克劳德”的角色而言似乎并不准确;见下文。)
《纽约时报》的一篇报道提供了更多细节。国防部的调查初步认定美国应对此次打击负责。该学校在多年前曾是伊朗一个军事基地的一部分,该基地目前毗邻学校。由于使用了国防情报局提供的、仍将该学校建筑视为军事基地一部分的旧情报,导致该学校被指定为目标。《纽约时报》自身对地理空间数据的分析表明,该学校在2013年至2016年间的某个时间与基地“被隔开”——这暗示国防部部分瞄准数据大约有十年之久未更新。
2024年9月,帕兰蒂尔公司发布了一份看似平常的新闻稿,称其已从美国陆军作战能力发展司令部陆军研究实验室获得一份为期五年、价值高达9980万美元的合同,内容涉及其Maven智能系统的接入扩展,该系统当时隶属于国家地理空间情报局的Maven人工智能基础设施。(Maven也于2025年3月被北约通信与信息局采购。)
Maven智能系统是2010年代“专家项目”的衍生产品,该项目旨在增强图像分析(例如,目标检测)和目标辅助领域的人机协作。“专家项目”曾在硅谷引起轩然大波,导致谷歌于2018年退出一份相关的国防部合同,从而为帕兰蒂尔公司扫清了道路。
显然,帕兰蒂尔为扩展Maven的功能已做了大量工作。该系统在伊朗的主要用途是目标生成及相关事务,如打击损害评估(估计爆炸半径等)。所有目标均由人工根据现行国防部政策选定。
暂时撇开Maven,考虑一下国防部的目标生成与选择流程(《经济学人》的沙尚克·乔希对此作了有益梳理):
• 选项生成:一名指挥官——例如负责监督美国中东行动的中部司令部指挥官——为特定场景生成目标选项。
• 数据库构建:这些选项依赖于情报部门,其利用卫星图像、信号情报及其他来源,构建包含数千个潜在目标的数据库。至关重要的是,该数据库包含由学校等建筑物组成的“禁止打击”清单。
• 弹药-目标匹配:随后,“武器专家”将目标与合适的弹药进行匹配(何种武器对何种目标最有效)。
• 法律咨询:律师会告知指挥官潜在打击的后果——但决定权在指挥官。
• 转化为作战计划:随后,战略与计划部门将该数据库转化为作战计划。
• 空中任务指令:作战计划被移交至作战部门,该部门将计划分解为(最多)未来两天的空中任务指令。
正如乔希指出的,历史上在此过程中会使用软件来评估目标毁伤概率、可能的平民伤亡、爆炸效应、模拟等。因此,历史上,人员需进行大量工作来生成和验证目标,并为此使用各种形式的软件。
Maven通过交叉引用开源和闭源数据,在冲突前和实时生成目标。后者可能是传统上构成已构建目标数据库的数据(分类数据)。前者包括的数据可能更适用于实时行动期间(而非仅限于规划阶段),例如可能包含社交媒体信息流,其中与特定敌方弹药移动相关的信息(即有人发布此类信息)可用于定位敌军位置(这是需交叉引用的数据之一)。
因此,Maven执行三项核心功能:
• 生成目标
• 匹配弹药与目标
• 评估可能打击造成的损害
鉴于Maven的结构和组成有一定推测性,要执行这些功能,应将Maven理解为一个嵌入各种子组件(用于不同功能的模块)的复杂系统。
部分子组件是用于指挥控制、目标情报、战斗损害评估等的模块。其他则是定制的人工智能模型,例如设计用于对地理空间情报等执行目标检测的模型(克劳德在Maven中不执行此功能)。
重要的是,这些子组件中只有一部分正确归属于“人工智能”范畴。如一些报道所指,将Maven视为“人工智能瞄准系统”是错误的。
Anthropic公司的“克劳德”大语言模型似乎是Maven的一个重要附加组件,但并非必要组件,原因有二。
首先,据乔希称,克劳德扮演高层级的同步角色,该模型以某种未指明的方式协调更广泛系统中的其他模块/人工智能模型。基于此,我们可以将克劳德视为一种复杂的接口或组织模块。从这个意义上说,Maven或许可以在没有克劳德的情况下运行,尽管可能会增加操作员为执行相同功能而必须手动完成的步骤数量。(另请注意,克劳德不直接提供目标建议;其功能从属于更广泛的Maven系统内的目标生成。)
前述报道中提到的“加速应用”“基于克劳德的系统”很可能指的是这种集成,而非从头开始围绕克劳德构建一个系统。
其次,正如历史学家凯文·贝克在一篇详细文章中所观察到的,与战斗损害评估、数据融合等相关的底层软件,其出现时间都早于包括克劳德在内的大语言模型,表明克劳德是事后添加到Maven中的。(另请注意,帕兰蒂尔的人工智能平台AIP,虽然使某些人工智能模型可被使用,但其出现时间同样早于克劳德与国防部保密网络的集成。)
帕兰蒂尔Maven系统所体现的复杂交互技术的实际应用表明——尽管国防部的打击精度在历史上仍保持较高水平,对伊朗女校的打击是一个重大失误——一个在关键任务行动中提供性能保证的系统,与一个被如此使用以至于人员实际上无法验证从目标生成到选择步骤的系统,这两者之间的区别并无太大意义。(这种使用方式表明,Anthropic首席执行官达里奥·阿莫代伊强调在使用致命武力决策中的可靠性,并不足以构成理解国防部当前倾向的框架。)
中部司令部未能验证国防情报局提供的数据(这一失误看似明显,尽管带有一定推测性),意味着目标获取的速度——遵循以色列国防军中更为突出的趋势——压倒了利用国家地理空间情报局数据验证目标的能力。事实上,中部司令部的查尔斯·库珀海军上将就人工智能在伊朗的使用评论道,人工智能被用于将数天或数小时的工作压缩至数秒,其速度快于敌人的反应速度。
这种观点并不特别新颖,正如贝克也详细阐述的,以快于美国对手能在物质上或心理上做出反应的速度生成更多目标,这一目标已有数十年历史,至少可追溯至越南战争中的美国战术和冷战时期的核威慑学说。如今像Maven这样的防务技术的使用,应被理解为战术优先于战略——正如乔希所指,是“卓越的行动能力”,但缺乏将目标与整体战争目标联系起来的“因果机制”。(关于为特定目标获取任务更定制化部署人工智能,可参阅我同事道格拉斯·罗伊斯最近关于巴西航空工业公司A-29“超级巨嘴鸟”攻击机集成人工智能模块用于无人机目标瞄准的文章。)
对于在防务技术相关领域工作的国防部承包商而言,关键在于能够服务于Maven等系统的技术的部署速度正被国防部置于优先地位。因此,“人工智能加速战略”的部分内容正在被认真执行。
具体而言,根据国防部副部长史蒂夫·范伯格3月9日的一份内部信函,Maven据称将被五角大楼确定为“记录在案项目”。Maven将在30天内(截至4月8日)从国家地理空间情报局移交至首席数字与人工智能办公室。此项指定将使国防部能够为该系统的长期资助和进一步巩固提供支持。
假设这些进展在未来几个月内得以实现,理解“人工智能”在美国目标瞄准中发展轨迹的关键,在于将相关技术置于国防部内负责目标生成和选择的组织结构之中。那些引人注目的人工智能模型的能力是且将继续是相关的,但任何孤立评估这些能力的尝试都将是不完整的。国防部使用Maven背后的组织原则,并非源于对克劳德这类人工智能模型能力本身的某种立场,而是通过使用相互关联的中间技术——人工智能模型只是其中重要但并非唯一的一组——来实现从目标选项到打击步骤的急剧压缩。
参考来源:dsm