帕兰泰尔技术公司成立于2004年,其创立基于一个简单的理念——人脑是识别信息模式最有效的方式,而计算机是处理海量数据最有效的方式。当人类能够在一个分析软件平台的计算能力之上充分发挥其智力,并找到这一最佳结合点时,执行分析的能力将可能发生革命性变革。正是基于这一简单理念,帕兰泰尔平台应运而生——这是一个用于执行分析的端到端解决方案。
本文报道了美海军战争学院评论杂志于发布的文章,介绍了人工智能在俄乌冲突中的首次大规模实战应用,如何改变战争形态,及其引发的技术、战略挑战。
自人类冲突伊始至今,军事领域中的人类智慧催生了许多重大的技术奇迹。美国国防部(亦被称为战争部)近期的动向,标志着战争创新进入了以人工智能为核心的最新浪潮。尽管此浪潮在近期达到高峰,但其蓄势已超过十年。2017年,因军方在尖端人工智能领域落后于商业部门,国防部启动了“专家计划(Project Maven)”,旨在为在叙利亚和伊拉克打击ISIS的军事行动提供人工智能支援。该计划加速交付了涉及“深度学习神经网络”的人工智能技术,包括通过分析无人机影像来识别ISIS武装分子以供后续打击。此举将美国推入了伴随人工智能战争时代而来的伦理与战略考量领域。
如今,多功能的“专家计划”为作战人员需求提供“海量的计算机视觉检测”。除该计划外,美国十八个情报机构及成千上万的情报分析人员正在使用中央情报局开发的生成式人工智能“奥西里斯(Osiris)”,将开源情报处理为带注释的摘要。在这些人工智能项目之上,国防创新单元(DIU)已部署了“复制者”计划的首批能力,该计划旨在连接“水面、水下无人机和巡飞弹药,以创造一个‘地狱景观’”。
尽管国防创新单元目前获取人工智能解决方案的速度快于以往,但美国防部显然仍面临一定程度的人工智能应用难题。美国陆军退役上将马克·A·米利与前谷歌首席执行官埃里克·施密特在2024年合著的文章有说辞,美国对未来的战争准备不足,未能全面接纳人工智能,且无法保护关键武器系统免受无人机攻击。
人工智能对乌克兰战场进程产生了深远影响,冲突双方正以惊人速度进行创新。美国专栏作家兼学者沃尔特·拉塞尔·米德对此评论道:“几周前还无法抵御的武器,今日已可被轻易压制。新的威胁一夜之间就会出现。”这种创新展现了人工智能在现代战场上的效能,并为窥见未来战争严峻且不断演变的图景提供了一个窗口。
提供作战数据
俄乌战争可被视为首场人工智能战争。面对俄罗斯2022年2月行动,乌克兰需要援助。来自以人工智能为核心的公司:微软、Palantir、Clearview以及众多初创企业。其中一些是出于支持该事业而来,包括提供无偿服务者;另一些则受美国与欧洲合同雇佣。这场战争为相关公司提供了扩展客户与测试系统的独特机会。Palantir科技公司首席执行官亚历克斯·卡普表示:“我们在战场上能做到一些在国内环境中无法做到的事情。”利用人工智能软件处理“来自无人机、卫星及地面乌克兰人员等来源的原始情报”——这些工作若由人力完成将耗费无数工时——实现了互利共赢。帮助开发专有人工智能的现实数据,同时也被有效且积极地用于协助保卫乌克兰公民。乌克兰数字化转型部长米哈伊洛·费多罗夫表示:“我们的重要使命是将乌克兰打造为世界的科技研发实验室。”众多在乌克兰设立的人工智能公司与初创企业,连同该国三十万名高水平的软件工程师、产品经理和技术专家,共同构成了这个实验室。斯坦福大学的史蒂夫·布兰克指出,俄乌战争标志着关键战场技术首次主要来自商业部门,而非联邦资助的研究实验室。
此项创新实现了数据驱动的作战,其速度与精度是北约尚未达到的。通过使用“德尔塔”系统——一个由乌克兰军方开发的基于云的情境感知与战场管理系统——乌克兰的战术与战略军事单位得以在平板电脑上查看战场,该平板电脑运行的软件融合了来自卫星、无人机、社交媒体以及商业和政府来源的图像与数据。借助星链和游荡弹药,小型部队可以使用这些平板电脑观察并快速打击以往仅高级指挥部才能攻击的目标。平板电脑上显示的人工智能赋能模型还能提供有效的目标选择方案,并随每次攻击提升其能力。米德写道:“武器重新设计与生产的速度正在加速,超越了以往任何战争所见。”这种变革速度是由精通技术的前线作战人员——其中许多是应征入伍的软件工程师——直接并持续地与远离战场、相对安全的实验室协作所驱动。随后,这些实验室在持续的开发-部署周期中,快速构建并向乌克兰国防部出售新的原型。
无人机的新颖应用是俄乌战争的标志性创新,一系列新的部署与设计正在投入使用。双方均以“空中上千名狙击手”饱和战场空间,快速打击地面与空中目标。更昂贵的火炮与反坦克导弹或许能击中并摧毁装甲车辆,但一群廉价的无人机更有可能发现、追上并打击车辆最薄弱之处。根据乌克兰议会国家安全、国防与情报委员会主席罗曼·科斯坚科的说法,无人机造成的伤亡约占俄乌双方伤亡总数的百分之七十——在某些战斗中高达百分之八十。乌克兰与俄罗斯各自计划在2025年生产三至四百万架无人机。作为对比,可以考虑同一战场中传统战争的结果。2023年,美国向乌克兰提供了三十一辆先进的“艾布拉姆斯”坦克。自那时起,其中十九辆已被击伤、摧毁或被俘获,且几乎所有剩余坦克均已从前线撤出。“艾布拉姆斯”坦克的遭遇预示着未来战争,对此至少米利与施密特看法一致:“未来战争将不再取决于谁能集结最多兵力或部署最佳战机、舰船与坦克。相反,它们将被日益自主的武器系统与强大算法所主导。”
尽管无人机的广泛使用可能是这场战争的标志性创新,但或许对未来战争影响最大的创新是乌克兰的模块化人工智能应用。人工智能正日益用于帮助无人机自动检测、锁定并引导至预定目标,即使在飞行员通信受干扰时亦然。在此类人工智能的增强下,无人机的成功命中率从大约百分之十至二十提升至约百分之七十至八十。乌克兰技术人员已将此类人工智能代码构建成模块,可即插即用于不同设计的无人机,以及需要目标检测的炮塔和其他平台。乌克兰另一项新的人工智能能力与声音相关。随着俄罗斯部署新武器,人工智能模型被训练用以识别这些武器产生的声音,仅需约一周时间收集足够大的数据集。尽管人工智能已赋能无人机的精确打击,但它还可能协助大规模或集群无人机攻击。据报道,乌克兰与俄罗斯均曾实施无人机集群攻击,操作员团队远程将无人机控制成集群,或同时发射数架“即瞄即射”无人机。尽管“无人机间自主协作的水平未知”,但乌克兰利用商业领域技术进步的能力表明,人工智能可在支持无人机“决策”能力方面发挥作用,乌克兰三至十架无人机集群的报道即为证据。
可以设想,人工智能能够控制大型集群,使无人机共享信息并协调行动。若一架无人机探测到对抗措施或障碍,理论上可通知一架监视无人机,后者进而警告集群其余部分并协调规避或风险缓解措施。攻击时,监视无人机可指挥针对目标采取必要行动。人工智能控制的集群攻击很可能压倒主要常规系统,而无人机集群也是对抗来袭无人机集群的合理防御手段。俄乌战争双方均在积极寻求人工智能控制的无人机集群。此发展意味着融合自动导航与目标识别功能,从而消除了人类对目标交战过程的监督。在俄罗斯,此种自动瞄准技术走向实用化的早期迹象已然出现。俄罗斯的“赫柏”诱饵“据报道采用网状调制解调器,使其能共享数据并形成某种集群”。
尽管乌克兰凭借商业领域享有技术优势,但俄罗斯愿意交换战时数据,这为从伊朗等来源获得人工智能发展援助打开了大门。2024年3月,俄罗斯与伊朗签署了一项人工智能合作协议。2024年末,俄罗斯总统发起了与金砖国家的人工智能合作网络,汇集了来自俄罗斯、巴西、印度、阿拉伯联合酋长国等国家的二十家公司。俄罗斯人工智能领域内的研发支出增加了百分之四十。这些国内与合作很可能深化并加速俄罗斯的人工智能发展。
在即将到来的、更由人工智能驱动的战争时代,战斗将涉及网络化自主系统,这些系统将在空中、陆地、海洋、太空及网络领域以前所未有的速度与规模游弋、发现并消灭目标——其中网络领域是人工智能与数字信息的关键通道。避免被探测将成为首要任务。优势将属于拥有能够更快、更好、更廉价地进行创新的精通技术的作战人员与开发者的一方。高损耗率将要求高产能与快速制造能力,而人工智能赋能战争将需要庞大的数字基础设施——此基础设施将成为敌方攻击目标。正如戴维·彼得雷乌斯将军与安迪·亚库利斯所言:“美国必须彻底改革其国防体系,从作战概念、组织结构、训练到武器系统、采购与制造。”
驱动机器人技术
乌克兰“哈尔蒂亚”旅指挥官向地面无人机器人部队下达了一项任务:在一周内,对利普齐(哈尔科夫地区一个被俄军占领的乌克兰村庄)的俄军阵地发动一次全无人机突击。该部队修订了作战方案,在突击开始前四十八小时,无人机已进入攻击位置。目标是在俄军发动反攻前,击中其指定目标。
2024年12月20日拂晓,乌克兰的空中无人机提供了战场态势感知。同时,多波武装空中与地面无人机攻击了俄军加固阵地。乌克兰截获的信号显示俄军陷入恐慌。一次协调的空中与地面无人机联合攻击似乎出乎俄军意料。两小时内,乌克兰的全无人机突击取得成功,且无一架无人机损失。乌克兰步兵部队随后迅速跟进并占领了阵地。
利普齐之战“是战争性质转变的重要一步,从纯人类行为转向21世纪某种截然不同的形态,”澳大利亚陆军退役少将米克·瑞安表示。在直接战斗中用自主武器系统替代人类作战人员——此乃乌克兰军方目标——标志着关键差异。机器不知恐惧、痛苦或疲倦,且可消耗性远高于人类。“那不过是个铁罐子。损失一架无人机远胜于牺牲一条人命,”乌克兰地面无人机器人部队指挥官对记者如是说。
然而,利普齐的无人机并非自主运行;乌克兰操作员远程操控了每一架无人机,并事先进行了三次突击演练。使无人机或移动机器人实现自主,需要模块化的人工智能模型来帮助它们在物理世界中感知、导航与行动。此类模型不同于在网络领域生成输出的大型语言模型。相较于开发空中与海上系统,开发自主地面机器人是更为困难的任务。地面环境更为复杂,包含多样且不平坦的地形、交通密集的城市迷宫以及分隔化的建筑结构。利用人工智能实现地面机器人自主性,需要大量与环境相关的数据,而传统上这类数据的收集与整理成本高昂。
但此类自主性已近在咫尺。在2025年1月6日于拉斯维加斯举行的消费电子展上,英伟达首席执行官黄仁勋宣称“一切可动之物皆将自主”。他进一步表示:“物理人工智能将化身为各行各业各种形态的机器人。”黄仁勋详细介绍了“世界基础模型”,这是一个旨在帮助人工智能理解物理世界并加速自主机器人开发的神经网络。“机器人大脑”——即模块化人工智能——驱动着自主移动系统。例如,英伟达的Thor芯片尺寸与智能手机相仿,能够运行自动驾驶车辆。此机器人大脑处理来自激光雷达、雷达和车载摄像头的输入数据,进而生成驾驶、泊车等动作。首先,机器人大脑由计算机“训练”。接着,大脑在“世界基础模型”中进行练习,模拟物理世界场景并收集数据以助其学习与改进。例如,一个“世界基础模型”可为自主叉车的“大脑”创建一个虚拟仓库供其练习、学习与改进。经过学习赋能、训练有素的“大脑”随后被部署于自主运行的机器人中。
模拟过程比现实世界数据收集更为迅捷。“世界基础模型”基于两千万小时的视频进行训练,专注于物理动态动作,并包含一个基于物理的模拟器。这些能力共同模拟了基于物理学的预期物理环境与使用案例,并生成“合成数据”。众多公司正利用英伟达的“世界基础模型”加速自主机器人技术发展:
“世界基础模型”正积极推动人工智能能力发展。该模型正在产出合成数据,而可公开获取的数据(由于网络域名所有者对其数据使用施加限制)正在减少。此模型还能训练大型语言模型,这些模型通常缺乏对物理世界的深入理解。部分专家认为,物理世界模型对于实现人工通用智能——或称人类水平智能——是必要的,例如知名开发者、“人工智能教父”之一的杨立昆即持此观点。
此类发展能力与美国国防部密切相关,该部正为各作战域寻求数以千计的可消耗自主系统。美国陆军对此需求尤为迫切,其宣称的目标是“首次接触零伤亡”。为实现此目标,陆军计划利用机器人塑造首次接触——而这将需要自主系统。敌方将持续试图干扰或破坏远程遥控操作——此问题可由自主系统规避。这些自主系统还必须为多样化的地面环境——城市、滨海及沙漠——进行开发,并能快速适应不断变化的敌方战术与武器。
未来战争将日益涉及自主系统。米利估计,约三分之一精良军队的军事力量可能在十五年内实现机器人化。此类军事系统将源自一个新兴的全球机器人产业。仅就人形机器人市场而言,截至2026年,全球至少有上百家制造商。数家主要机器人制造商预计于2025年开始大规模生产。全球金融服务巨头摩根士丹利预测,到2040年,全球将拥有八百万台人形机器人。
英国皇家联合军种研究所的一份报告指出:“致命性自主武器系统的扩散不可避免。”相较于以往的系统,这些机器将以更高的精度与确定性实施杀伤,不受爱恨情感影响,并具备超越人类的速度与机动性。其滥用可能性与潜在影响似乎无可估量。摧毁无人机器的威胁,其威慑效果远不及战争中人类遭受苦难的威胁。世界正面临一个伦理困境。实现治理并确保致命性自主权的正当使用,维持人类控制以限制此种自主权,以及在人工智能时代重新思考威慑战略,仅仅是这一新前沿领域所面临的诸多挑战中的几项。
本报告围绕模型架构设计、预训练与后训练方法、模型部署技术、典型应用场景以及安全与伦理等多个方面,对年度内的重要研究成果与实践进展进行了系统总结与分析,旨在为相关领域的研究人员、技术开发者及决策者提供有价值的参考。与侧重技术演进脉络的传统综述不同,本报告更加关注2025 年度内具有代表性的最新进展与趋势判断,力求呈现当前大语言模型研究与应用的前沿图景。
美国陆军作战能力发展司令部(DEVCOM)陆军研究实验室(ARL)的研究人员,与中佛罗里达大学的合作伙伴共同,正在开发一种智能任务规划技术。该技术能够利用经机会性感知的任务内信息和任务相关环境特征训练的模型,预测整个任务区域内的表现和工作负荷。此能力将为改进任务规划提供关键信息,并能在任务执行过程中优化对士兵的实时要求。迄今为止,我们已经进行了两项名为第一阶段和第二阶段的调查研究,以开发和评估此能力。本报告旨在详述两项研究的流程与发现,并在最后对计划的后续研究进行讨论。
已于2023财年结束的第一阶段研究,其关键目标是确定如何将参与者在事后评估(AAR)中的反馈与任务内数据相结合,以预测参与者在后续任务中的工作负荷和表现。这是验证工作负荷预测算法闭环设计的关键第一步。该算法处理任务和事后评估数据,为后续任务规划提供信息,进而产生新的任务和事后评估数据,如此循环。2024财年第二阶段研究的关键目标,是将此概念扩展到两名参与者协作,使用智能任务规划技术共同规划和执行任务,并测试一种新的协同任务规划用户界面(UI)。此阶段验证了一种能够在多人员、多智能体场景中随任务迭代自适应的学习流水线概念,并通过评估该规划技术在多大程度上提升了多人员、多智能体团队的表现成果,为进一步扩展和优化奠定了基础。
本研究的主要贡献在于证明:一种可随任务迭代演进的算法,可用于预测变化任务区域内的广义工作负荷;并且这一学习流水线在多人员、多智能体模拟环境中是有效的。未来作战环境的复杂性将要求有效综合不同数据流,为决策和行动的前向预测提供信息,此项初步工作已展示了一种实现此目标的方法。在理想的使用场景中,智能任务规划技术将能够告知士兵,战场空间中哪些区域将涉及具有挑战性的情况,从而使作战人员能够在任务规划期间做好准备并加以考虑。未来的研究将朝着这个目标采取必要的步骤。
图4 这四幅图像描绘了影响我们成本地图计算的地形图层。从左至右,这些地图分别包含地形植被、城区、障碍物和视域信息。由于这些数据已针对整个仿真环境预先计算完成,将其用于工作量计算。称这些为“预计算地形信息”。
在反无人航空器系统(C-UAS)领域,一个常用术语是探测、跟踪与识别(DTI)。DTI包括探测、定位、跟踪、分类与识别。本报告全面概述了探测、定位与跟踪技术,重点阐述了所涉及的复杂性和挑战,并触及分类与识别技术。报告通过界定关键术语和概念(如C-UAS、C-UAS传感器、C-UAS系统、C-UAS解决方案)建立了一个共同的语境。传感是指使用技术和方法来探测物理现象:报告探讨了各种C-UAS传感模态,包括声学、光电、雷达和射频(RF)传感器。报告重点阐述了每种模态的优势与局限,以及传感器数据融合在实现更有效、更稳健的C-UAS探测、定位与跟踪中的重要性。
本报告提供了技术概览,并为参与C-UAS领域的利益相关方之间的社群构建和信息共享,提供实用指南和操作支持。报告面向那些希望对C-UAS探测、跟踪与识别所涉及的复杂性和挑战有更深入理解,并希望了解C-UAS技术最新发展的读者。
目录
摘要
1 引言
1.1 欧洲反无人机系统(EC C-UAS)政策
1.2 定义
1.3 反无人机系统保护模型
2 探测、跟踪与识别
2.1 人类探测与跟踪无人机的简单示例
2.2 探测无人机的一般原理
2.3 探测、定位、跟踪与确认
2.4 分类与识别
2.5 传感器局限性
3 探测、定位与跟踪技术
3.1 声学传感系统
3.2 光电(相机)传感系统
3.3 基于雷达的传感系统
3.4 基于射频的传感系统
3.5 人类感应
3.6 探测、定位与跟踪技术总结
4 技术融合
4.1 组合传感系统覆盖范围
4.2 传感器数据融合
4.3 多变量反无人机系统性能
4.4 测量系统性能
5 结论
参考文献
附录
本研究在联合能力领域的背景下,探讨了有人-无人协同概念,并研究了未来打击作战中有人与无人编队的扩展杀伤链。研究首先阐明了有人-无人编队可实现的能力。随后,为一次有人-无人编队(打击)作战设计了参考任务,从而能够对扩展杀伤链进行作战活动与功能分析。研究建立了仿真模型,以检验有人-无人协同概念的时间效率。本研究利用模型结果所获得的见解,探索了兵力生成与系统链接战术的替代方案。对打击作战周期时间(包括总任务操作时间、空中飞行时间及完成系统链接所需时间)的分析,为生成建议提供了数据支撑。除识别出应重点关注效率提升的领域外,本研究还提出了旨在提升有人-无人编队打击作战效能的战术与作战概念。研究表明,战斗机续航力是有人-无人作战中的一个限制因素,并提出了同步发射或预发射建立通信与数据链作为缓解这些限制因素的可行途径。
传统上,侦察任务使用无人驾驶飞行器(UAV)。在近年来的作战行动中,UAV已被用于针对地面目标的专用打击任务。无人机集群技术的最新进展,为将集群无人机系统与有人战斗机集成以实现传统上由有人机完成的能力提供了机遇。具备自组织能力,并能通过信息共享和集体态势感知来协作以实现共同目标的无人机网络,被称为集群无人机网络。有人与无人机的协同编队,可能成为未来作战中的颠覆性技术。
本研究基于联合能力领域框架,识别了由集群无人机系统与有人机协同所实现的能力。这些能力被映射回该框架,以确保所识别的能力与当前的能力需求相关。针对地面打击任务的有人-无人协同,是被确定需进一步研究的潜在能力之一。研究制定了一项由有人-无人打击编组执行的战略地面打击设计参考任务。该设计参考任务包括场景描述、威胁详述,以及对作战活动与功能的分析和映射。
杀伤链是指一系列按既定顺序成功执行后,可导致目标或标的被摧毁的活动序列。传统上,杀伤链仅指定目标定位、识别、指定和交战的最后阶段。在本研究中,开发了一个扩展杀伤链,将兵力生成、有人/无人通信建立(链接),以及进入与退出过程纳入其中。基本的杀伤链和扩展的杀伤链随后使用 Imagine That Inc. 的 ExtendSim 9.0 离散事件仿真软件进行建模。ExtendSim 能够对沿着规定路径在模型中穿行的仿真项目(这些项目由离散活动生成和处理)进行建模。路径上的活动块模拟服务的执行或对项目施加延迟。研究人员为每个仿真项目分配属性,以助于理解项目在模型中移动时的行为与特征。
研究选取了效能衡量标准来评估扩展杀伤链的限制因素。这些效能衡量标准包括:总任务时间、任务时间和会合时间。总任务时间衡量从兵力生成开始到打击编组完成返回发射平台的时间。任务时间衡量兵力处于空中的总时间。会合时间衡量打击编组完成编队所需的时间。在本研究中,一个有人-无人协同打击编组被定义为包含四架有人战斗机和八架无人作战飞行器的飞行编队。对于基本杀伤链,任务成功率(定义为目标摧毁百分比)被确定为单一的效能衡量标准。
对于基本杀伤链模型,分析集中于各杀伤链流程成功率对任务成功率的主要影响。分析发现,虽然命中概率和毁伤概率对任务成功率有一定影响,但正确目标解算的概率对任务成功率的影响最大。
对于扩展杀伤链模型,分析侧重于识别扩展杀伤链中各个流程对效能的主要影响。扩展杀伤链模型的结果表明,有人-无人协同打击编组的限制因素在于打击编组的空中编队形成。仿真显示,战斗机或无人作战飞行器在会合点等待消耗了大量时间。在仿真中,并未尝试同步有人机与无人机的生成。因此,如果一架有人机首先到达会合点,而没有无人机与之进行链接,结果就是该有人机不得不在会合点等待无人机的到来。这种在会合点的非同步到达造成了效率低下,并导致宝贵的空中时间被浪费。研究随后提出了三种替代方案,旨在通过扩展有人战斗机的续航力,或通过同步化或改变扩展杀伤链中的活动顺序来最小化任务时间。
这三种替代方案包括:使用空中加油机以延长有人战斗机的续航力;有意同步飞机发射,以实现飞机在会合点的"准时"到达;以及在发射前建立有人机与无人机之间的通信链接。
对所有替代方案进行了分析,以深入了解各自对任务时间和会合时间的影响。同时详细阐述了每种方案的益处与挑战。最后,利用Pugh矩阵的Pugh方法被用来确定三种方案中哪一种最为合适。方案分析表明,虽然同步飞机发射能显著减少会合时间,但其所需的作战时间仍然长于有人战斗机的续航力。因此,对于此方案,仍然需要空中加油。另一方面,在发射前建立有人机与无人机之间的通信链接,则将"会合时间"从任务时间的计算中移除。结果,与原始作战时间相比减少了两个小时,使得执行有人-无人协同打击作战时无需空中加油机成为可能。然而,由于视距通信的要求,发射前链接将需要将两个发射平台部署在更近的距离内,这随之增加了两个发射平台的风险。
随着无人机在军事行动中的使用日益增多,加上无人机网络集群技术的出现,在争议空域使用有人与无人机协同执行地面打击任务,呈现出对抗任何对手的潜在颠覆性能力。本研究揭示了此类打击作战扩展杀伤链中可能影响作战效能的环节。它识别了可能的战术、作战概念和未来能力,这些将提高有人与无人机执行打击作战的作战可行性。
发布主体:上海交通大学安泰经济与管理学院、上海交通大学行业研究院 “人工智能 +” 行业研究团队,主编史占中、陈晓荣,联合数十位业界专家,2026 年 4 月正式发布,历时 4 个月编撰完成。**
**核心定位:立足国家 “人工智能 +” 行动政策指引,以技术 — 产业 — 治理为主轴、“技术在重构、产业在跨越、治理在完善” 为主线,构建三篇十章、近 200 页的系统化分析框架,全面解析全球与中国 AI 产业全景,为政府决策、企业战略、投资布局提供权威参考。
美军弗吉尼亚州阿灵顿讯(空军新闻处)——美空军部首席数据与人工智能官办公室于4月20日宣布,公开发布《空军部数据战略》与《人工智能战略》。
两份战略为空军部提供了一份战略路线图,旨在使其成为一支“以AI为先的军种”,将数据与人工智能实际运用为决定性的力量倍增器与战略资产,从而在从会议室到战场的各个环节保持空中与太空优势。
这一统一框架加速了企业级与作战能力的发展,为应对近似竞争对手提供了决定性的决策优势。这些战略与《2026年国防战略》及《2026年战争部人工智能战略》相契合,特别支持了战争部长关于通过技术优势重建威慑力量的优先事项。
美空军部长特洛伊·梅恩克在《人工智能战略》前言中表示:“我们的重点并非为AI而发展AI,而是迅速提供能够解决现实世界作战问题的、切实可投入战斗的能力。通过成为一支以AI为先的军种,我们将赋能我们的作战人员,使其在思维、机动和速度上超越任何对手。”
这些指导性文件在从训练战备到多域作战等多个不同任务领域确立了人工智能的优先事项。战略认识到数据是现代战争的弹药,强调将数据视为战略资产,并通过采用去中心化的数据架构,确保空军部能够以任务所需的速度为作战人员提供可信数据。
美空军部首席数据与人工智能官苏珊·达文波特表示:“在当今复杂的全球安全环境中,数据和人工智能已不再是辅助职能——它们是我们战略优势的基石。执行这些战略将确保空军部保持敏捷,并决定性地领先于步步紧逼的威胁。”
这些战略的实施直接推进了首席数据与人工智能官办公室2026财年的目标,即制度化地将数据和人工智能确立为核心任务组成部分。此项努力建立在战争部长“速度制胜”的优先事项之上,旨在保持不懈的步伐,将人工智能赋能的战斗力交到今日操作者手中,以赢得明日的战斗。
目录 执行摘要
引言
人工智能的必要性
利益相关方
范围
指导原则
愿景
任务领域
战略要务
战略实施
数据、技术与基础设施
人才与人力
合作伙伴关系与生态系统
变革管理与流程再造
人工智能治理与监督
行动号召
数十年来,空军部(DAF)通过掌握当代技术,始终捍卫着我们国家的利益。我们在创新领域的领导地位保证了我们的决策优势与作战敏捷性。今天,在一个以持续且快速演变的战略挑战为特征的时代,这一传统必须确保我们在人工智能(AI)领域的领导地位。我们的对手正在大力投资以侵蚀我们的优势,我们必须有目的、有速度地采取行动,以保持我们的优势。本人工智能战略对于将我们的人员作为战略资产加以利用、增强战备状态与杀伤力、以及实现我们的空军和太空军的现代化以确保我们国家的竞争优势,具有根本性意义。
本战略的核心在于确保空军与太空领域的人工智能优势。通过成为一支“以人工智能为先的部队”,我们将赋能我们的作战人员,使其在思维、机动和速度上超越任何对手。这是对我们战备状态的一项直接投资,借助人工智能来加速决策、增强预测性维护并优化后勤,从而以前所未有的高效方式生成战斗力。人工智能不是未来的小众技术;它现在已成为一项不可或缺的能力,必须立即整合到我们的平台和任务集中,作为我们战备状态的基石、增强杀伤力和重建威慑力量的基础,以及我们现代化努力的基石。
前进的道路是清晰的:我们必须加速。我们将紧迫地从谨慎试验的姿态转向全企业范围内的规模化运用。我们的重点并非为发展人工智能而发展人工智能,而是迅速提供能够解决现实世界作战问题的、切实可投入战斗的能力。我期望空军部的每一位领导者都能倡导这项努力,破除壁垒,赋能我们的创新者,并毫不松懈地专注于将人工智能赋能的能力交到操作者手中。成功执行这项战略并非可选项;它对于保持我们国家期望并理应拥有的空中与太空优势至关重要。
空军部根据《国防战略》、《战争部(DoW)人工智能战略》以及国防部(DoD)《数据、分析与人工智能应用战略》所确立的授权发布本人工智能战略,用以指导整个企业范围内的开发与实施。人工智能对于支持战争部长的优先事项——重振尚武精神、重建军事力量、重建威慑力量——至关重要。人工智能将通过先进模拟和智能决策支持工具增强作战人员能力,通过优化维护计划和预测性分析加速部队现代化,并通过增强情报分析和自主系统提供技术优势,从而支撑可信的威慑。
大数据、云计算和深度学习的普及极大地提升了人工智能能力,并对军事行动产生了直接影响。为保持决定性优势,在整个空军部范围内采用人工智能是一项战略要务。为实现这些目标,空军部的愿景是成为一支“以人工智能为先的部队”,利用智能自动化、预测性分析和自主能力,通过增强作战人员决策的人机协同,实现决策优势和作战敏捷性。本文件是空军部内部人工智能开发与实施的战略愿景和指导框架。它阐述了采用人工智能的“是什么”和“为什么”。此外,空军部将发布一份即将出台的人工智能实施计划,详细说明其将如何提供核心构建模块,以使美国空军(USAF)和美国太空军(USSF)能够将这些战略任务领域付诸实施。
空军部将通过作为主要实施手段的五个战略构建模块来实现其人工智能目标:建立安全的数据、技术和基础设施基础;培养一支具备人工智能素养的劳动力和获取行业专业知识;建立充满活力的合作伙伴关系;推动变革管理;以及实施敏捷的人工智能治理与监督。通过在整个人工智能生命周期中建立明确的角色并投资于这五个构建模块,空军部将获得决策优势、作战敏捷性和技术优势,从而在一个日益复杂的世界中保障国家利益。
人工智能的必要性
人工智能驱动的战争时代已经到来。在从网络空间的深处到广阔太空的每一个领域,空军部所面临的威胁速度太快、数量太多、过于复杂,以至于单靠人类操作员已无法应对。我们的战略优势不再仅仅取决于我们平台的质量,而是取决于我们决策的速度和质量。
人工智能是在这一新环境中赢得胜利所必需的决策优势的关键。它是驱动联合全域指挥与控制(CJADC2)的引擎,也是引导我们自主系统的智能。随着我们的对手大力投资以缩小技术差距,我们对创新的承诺必须是决定性和坚定不移的。
为确保下一代的空中与太空优势,空军部将利用人工智能的变革性力量来实现以下目标:
利益相关方
本战略的成功依赖于广泛的利益相关方的协作与支持。空军部将继续积极与战略伙伴接触,包括战争部长办公室(OSW)首席数字与人工智能官办公室(CDAO)、空军部首席信息官(CIO)、情报界(IC)、人工智能开发者和研究人员、行业合作伙伴、学术界和国际伙伴,利用他们独特的视角和专业知识,在空军部内充分发挥人工智能的潜力。
本战略的成功取决于战略指导与战术实施之间的无缝协调。各级组织都对空军部的成功负责。
范围
本战略涵盖空军部从基础技术到先进自主系统的人工智能能力生命周期,侧重于人工智能在作战和决策中的应用。本战略阐述了支持充满活力的人工智能生态系统所必需的数据基础、流程、技术、人才和治理,并与《2026年国防战略》和《2026年战争部人工智能战略》保持一致,并对《空军部数据战略》形成补充。
指导原则
空军部人工智能战略与《2025年美国人工智能行动计划》¹、《2026年国防战略》、《2023年国防部数据、分析与人工智能应用战略》² 以及《2026年战争部人工智能战略》³ 保持一致。以下原则将指导空军部内所有人工智能的开发与部署:
为实现空军部保持世界一流部队的愿景,人工智能实施的技术和操作框架将由这些基本原则指导。空军部内的每一项人工智能计划都必须符合这些原则,以确保有效且以任务为中心的部署,从而确保人工智能在数据、技术、人才、合作伙伴关系和治理方面都有效。在这一原则性基础上,空军部将通过五个战略任务领域来追求人工智能集成,旨在最大限度地提高作战人员效能和作战优势。
¹美国总统行政办公室,科技政策办公室。《赢得竞争:美国人工智能行动计划》。白宫。2025年7月10日。可见于:https://www.whitehouse.gov/wp-content/uploads/2025/07/Americas-Al-Action-Plan.pdf ²国防部。《数据、分析与人工智能应用战略:加速决策优势》。2023年11月2日。可见于:https://media.defense.gov/2023/nov/02/2003333300/-1/-1/1/dod data analytics ai adoption strategy.pdf ³美国战争部。《战争部人工智能战略》。2026年1月9日。https://media.defense.gov/2026/Jan/12/2003855671/-1/-1/0/ARTIFICIAL-INTELLIGENCE-STRATEGY-FOR-THE-DEPARTMENT-OF-WAR.PDF
愿景声明
空军部是一支“以人工智能为先的部队”,通过变革性能力提供无与伦比的战略优势,这些能力提高了任务链路的速度、精度和敏捷性,从而增强整个部队的决策、战备状态和效能。
任务领域
为实现这一愿景,空军部将在所有任务领域中利用人工智能作为力量倍增器:
用于多域作战决策优势的人工智能:利用人工智能,通过提高观察保真度、通过更好的感知和上下文理解来丰富态势判断、促成更明智的决策、以及提供用于在竞争环境中获得决定性优势的自主能力,来增强“观察、判断、决策、行动”(OODA)循环。
用于战备与持续保障的人工智能:利用人工智能优化资产可用性、提高维护效率、精简供应链,并改善整个空军部的资源管理。
用于企业优化与人力增强的人工智能:部署人工智能以增强后台职能、改进人事管理、为所有人员提供通用的认知辅助,并释放人力资本用于更高价值的任务。
用于研究、开发与现代化的人工智能:利用人工智能大幅优化和加速国防能力的整个生命周期,从初始概念开发到作战部署和持续保障。
用于训练、教育、建模与模拟的人工智能:将人工智能整合到训练方法中,以创造更逼真、适应性更强和个性化的学习环境。
以下战略要务定义了我们成为一支“以人工智能为先的部队”的路径。
空军部加速采用人工智能的愿景建立在一系列必须建立并完善的基础构建模块之上:数据、技术和基础设施;人才与人力发展;合作伙伴与生态系统管理;变革管理与流程再造;以及人工智能治理与监督。这些努力将被优先考虑,以直接支持战争部的全部门引领性项目,并确定和执行与空军部人工智能任务领域相符的快速跟进计划,以迅速推广其成功经验。这些构建模块为全企业范围的人工智能实施提供了结构性基础,建立了必要的基础能力、流程和治理框架,以满足战略要务并实现我们五个任务领域所概述的能力。
任务和系统负责人负责将人工智能整合到其职能领域。任务负责人在其指定范围内拥有决策权,并负责在能力成熟时与过渡伙伴进行协调。清晰的交接规程和决策权矩阵将在实施指南中确立,以确保在整个能力生命周期中持续问责。
空军部首席数据与人工智能官办公室(CDAO)将通过有意识地执行以下构建模块,将这些战略概念转化为运营现实:
空军部将革新其数字基础设施,创建一个灵活、安全且可互操作的基础,以大规模支持人工智能的开发和部署。在联合作战云能力(JWCC)的基础上,空军部将构建一个有弹性的数据和技术层,使其可在所有安全级别和前沿部署地点访问。空军部的基础设施将支持一种从云端到边缘的混合运营模式,支持本地、平台和战术部署,确保即使在断连、间歇和有限带宽的环境中也能可靠地访问人工智能。空军部将优先发展边缘人工智能能力,以实现实时决策并增强杀伤力,同时扩展全企业范围内的云能力,并向开放数据架构过渡。为加速人工智能开发和准确性,空军部将为其部队配备人工智能就绪数据、先进计算能力和现代软件工具链。这些资源将包括合成数据生成、自动化流水线、预训练模型和自定义代理,所有这些都旨在为作战人员快速、安全地提供人工智能。
企业人工智能基础设施包含支持整个空军部人工智能开发和部署所需的基础性、共享的先进技术。空军部首席数据与人工智能官办公室将通过数据与人工智能治理结构,捕获企业人工智能需求,并引导其完成预算和采办流程。空军部首席数据与人工智能官办公室、空军负责采办、技术与后勤的助理部长(SAF/AQ)和空军负责太空采办与集成的助理部长(SAF/SQ)将提供采办专业知识,整合跨任务领域的需求,并确保全企业范围内的互操作性标准。这种方法将优先采用经过验证的战争部和空军部企业级能力,并实现重复能力的整合,使任务负责人能够专注于特定领域的人工智能应用,而非底层基础设施开发。
任务负责人将与企业数据服务部门合作,识别任务关键数据集,并提供必要的领域专业知识,使其数据可用于人工智能应用。任务负责人将与空军部技术团队协作,确保其数据通过既定的数据治理框架符合“可见、可访问、可理解、可链接、可信、可互操作和安全”(VAULTIS)原则,并为人工智能应用做好准备。任务负责人将利用空军部和战争部的企业架构和基础设施,尽可能使用数据服务和战争部企业数据集,以最小化冗余并优化资源。
通过投资现代化、可扩展和安全的数字基础设施,空军部将释放人工智能的全部潜力,增强作战效能,并在未来的作战空间中保持竞争优势。如果缺乏敏捷和适应性强的数字基础设施、开放和协作的数据架构、以及安全和可靠的数据系统,空军部将无法利用人工智能及相关技术的潜力来获得作战优势。
存在一种普遍的误解,认为人工智能无论从组织上还是所需技能上都应与信息技术(IT)对齐。然而,对特定业务流程的深入理解对于有效实施人工智能至关重要。将人工智能专业知识局限于IT部门,可能会使相关举措与核心业务目标和领域特定知识脱节。人工智能人力需要一套有别于IT的可衡量能力组合,包括数据分析和解释、批判性思维、统计推理、流程映射、商业头脑、沟通技巧、项目管理、变革管理,以及对数据和算法中无意偏见的操作风险的意识。成功的人工智能举措依赖于一个多学科团队。一个成功的人工智能实施团队应兼具技术和特定业务背景方面的专业知识,以确保人工智能解决方案得到战略应用、符合法律规定且在操作上有效。
为有效培育这种环境并实现人工智能的全部潜力,空军部首席数据与人工智能官办公室将建立一个全面的人才管理生态系统。这首先要通过标准化的、全企业范围的培训和认证途径,为所有人员建立人工智能素养基础。这些计划将分层次,从基础概念到人工智能编排、边缘部署和智能体管理等高级技能,以适应不断变化的使命要求,并确保人员有能力理解、使用、监测和评估人工智能应用。
为吸引和留住顶尖人才,空军部将定义清晰的职业路径,与战争部网络空间人力(DCWF)人工智能工作角色对齐,并配备适当的激励措施和有针对性的招聘策略,利用战争部网络空间人力的“知识、技能、能力和任务”(KSAT)框架。空军部将合作制定一项全部门范围的人工智能人才管理战略,将人工智能专业人员安排在能够增强空军部杀伤力的岗位上。这项人才管理战略将考虑诸如“特殊经验标识符”和岗位标签等机制,以优化人工智能专业知识的分布。空军部首席数据与人工智能官办公室将通过数据与人工智能小组和委员会,与战争部首席信息官办公室和首席数字与人工智能官办公室合作,创建和管理人工智能特定的KSAT工作角色,以发展、保留和壮大这种技能组合。这个生态系统将得到支持,通过提供全企业范围的学习平台、数据集和计算资源访问权限,以持续发展技能。为引导这项工作,领导层将通过政策和资源分配,培育一种“快速失败,更快学习”的文化,创造一个创新能以相关速度蓬勃发展的环境。
任务负责人负责在其组织内倡导这种转变。具备人工智能素养的领导者将确保所有人员都具备人工智能素养,将识别和培养新兴的人工智能人才,并将实施适合其作战环境的人机组队实践。具备人工智能能力的主管将把人工智能能力要求整合到职位描述和绩效评估中,以支持人员的职业发展。具备人工智能资质的组织领导必须允许人力成员参加企业培训计划,提供现实的人工智能实验机会,提名人员参加人工智能教育,并在本地营造一种拥抱创新和采纳人工智能的文化。
空军部将通过加强与行业、学术界、国际伙伴和其他政府机构的合作伙伴关系,培育一个充满活力和协作的人工智能生态系统。本战略的指导原则是一种平衡的方法:优先采用经过验证的商用现货(COTS)和军民两用技术(只要它们满足任务需求),同时将定制开发工作重点放在作战任务特有的能力上。为确保获得最先进的能力,空军部将优先与推动全球创新的前沿人工智能实验室建立合作伙伴关系,同时也利用更广泛的商业供应链,并减少对对手来源的依赖。SAF/AQ 和 SAF/SQ 将与空军部首席数据与人工智能官办公室(CDAO)合作,利用采办途径获取人工智能能力。空军部首席信息安全官(CISO)将与采办领导层和战争部长办公室首席数字与人工智能官办公室协调,为人工智能系统和能力建立网络安全要求,包括供应链评估和供应商风险管理规程。标准化的合作伙伴框架、知识产权指导和技术转移流程将有助于简化协作。为优化资源分配和知识共享,空军部将保持对所有人工智能开发活动的全企业可见性。
任务负责人是这个生态系统的运营驱动者。任务负责人负责在其领域内识别合作伙伴机会,并积极参与有利于其特定任务领域的联合计划。任务负责人将识别军民两用人工智能机会,并与行业合作伙伴合作,将商业技术适配用于国防应用。任务负责人必须通过空军部建立的采办途径和框架与相关伙伴接触,提供明确的需求和反馈,为合作伙伴关系战略提供信息。任务负责人将遵守首席信息安全官(CISO)确立的人工智能安全要求,并在采办过程中支持网络安全审查。此外,他们应确保有前途的人工智能原型能够快速、安全地转化为作战能力,在整个企业内分享经验教训,并保证所有合作伙伴关系都遵守空军部的安全和合规标准。
空军部首席数据与人工智能官办公室将建立一个全面的变革管理框架,将人工智能的采用视为一场组织转型,而不仅仅是技术实施。单靠技术无法实现转型。成功的人工智能集成需要对工作流程、组织结构和政策进行有意识的重构,这始于我们评估和招聘人员的方式。空军部将开发标准化的变革管理方法论,伴随人工智能举措,确保技术能力与人员流程之间的无缝集成。这些包括流程再造、通过运营指标衡量转型成功、掌握人类在环中的能力,以及创建反馈循环,使人能工智能系统及其所支持的流程都能持续改进。
任务负责人将在其特定领域内作为人工智能转型的运营倡导者,通过积极参与流程再造工作,并确保其人员为人工智能增强的工作流程做好准备。任务负责人将确保空军和太空军人员参加企业人工智能培训计划,并与技术团队合作确定适合人工智能驱动优化的操作流程,并与企业变革管理团队合作,对这些流程进行重新设计,以实现最大效益。这些任务负责人将按照空军部标准实施新的工作流程,就流程变更的实际影响提供反馈,并确保其组织在转型期间保持卓越运营。任务负责人还将培养一种持续改进的文化,使人员能够在人工智能能力成熟时,被授权提出流程改进和运营增强的建议。
空军部首席数据与人工智能官办公室将实施一个全面且敏捷的治理框架,将治理重新构想为加速能力而非阻碍能力的工具。这个框架将确保所有人工智能能力都能以快速且合法的方式开发和部署。空军部数据与人工智能委员会将从风险管理的姿态转向积极消除壁垒的使命。
空军部数据与人工智能卓越中心(CfE)将作为这项工作的前沿单位,负责积极评估和消除官僚摩擦。当卓越中心无法解决系统性或跨职能问题时,将立即上报给空军部数据与人工智能委员会和小组,由企业决策,或根据需要提交给战争部“壁垒消除委员会”。壁垒消除委员会有权豁免非法定要求,并将阻碍因素上报以求立即解决。这种结构为消除壁垒创建了明确的上报路径。
空军部的测试与评估(T&E)企业必须以战争的速度执行其使命。目标是创造足够的证据以做出快速部署决策,而不是一份详尽无遗但会延迟部署的检查清单。人工智能能力的测试与评估将是一个持续的、适应性强的框架,侧重于为任务关键功能提供信心。它将持续评估能力、网络弹性和安全性,确保可信度和客观性与任务风险相称,同时不懈地将能力推向作战人员。虽然空军部将满足所有法定的和法律的强制性义务,但我们将质疑任何不直接为作战人员增加价值的、遗留的、非法定的要求。法定授权和法律义务包括但不限于管理IT投资的标准,包括《克林格-科恩法案》、《隐私法》、《联邦信息安全管理法》、《美国法典》第10编第2222条、第508条、档案管理和互操作性标准。
任务负责人负责在其运营领域内实施这些治理实践。他们的主要责任是快速交付能力。任务负责人应将卓越中心视为克服障碍的主要合作伙伴,并应立即识别并向卓越中心报告任何官僚摩擦。他们必须将这种理念整合到其开发流程中,与测试与评估部门合作以加速评估,并利用已建立的上报渠道。
空军部正处在一个关键时刻。人工智能为空军部的作战能力、运营效率和战略态势提供了一个根本性的变革机遇。本战略提供了一个清晰的路线图,以掌握主动权,大规模实施人工智能,并确保在所有领域加速获得决定性优势。
成功需要空军部上下的统一行动,从最高领导层到基层作战单位。空军部首席数据与人工智能官办公室致力于以紧迫感、透明度和协作精神倡导这场转型。通过恪守本战略中概述的原则并执行战略任务领域,将利用人工智能的力量,锻造一支更具杀伤力、更具韧性、并最终更具主导地位的空军和太空军。
目录
前言
执行摘要
缩略语
引言
数据的必要性
利益相关方
范围
指导原则
愿景
愿景声明
支柱
支柱一:简化的数据发现与可访问性
支柱二:增强的数据信任与互操作性
支柱三:增强的数据驱动型决策
挑战
战略实施
治理与责任
数据就绪
数据网格环境
数据驱动型人力资源
行动号召
参考文献
在持续战略竞争的时代取得胜利,我们必须获得决策优势。实现这一目标需要将数据视为战略资产,这对于综合威慑和与联合部队的协同至关重要。
长期以来,碎片化和孤岛式的数据阻碍了我们的作战敏捷性。《空军部数据战略》提供了一个框架,通过从遗留架构转向去中心化的数据管理方法,将数据作为可安全快速共享的产品,来纠正这一问题。建立一个以数据为中心的企业将使全体部队能够利用数据实现任务成功。
执行此战略是国家安全的需要。我期望各级领导者都能推动这一变革,并打破阻碍其成功的组织壁垒。
通过以任务所需的速度为我们的作战人员提供可信数据,我们将武装他们以实施威慑,并在必要时取得胜利。行动的时刻就是现在。
本文件确立了空军部推进数据现代化和实现信息就绪状态的战略方向。在“可见、可访问、可理解、可链接、可信、可互操作和安全”(VAULTIS)数据原则以及国防部(通称“战争部”,DoW)指导文件(包括《2026年战争部数据战略(待发布)》和《2023年国防部数据、分析与人工智能应用战略》)的指导下,本《空军部数据战略》概述了一个强大而敏捷的数据生态系统,旨在赋能各层级的决策者。空军部将通过采用去中心化的、领域驱动型的数据管理方法,解决当前数据架构中的关键挑战。数据将被视为战略资产,可通过自助服务工具发现和获取权威数据。去中心化的数据管理方法将增强数据透明度、提高互操作性、改善决策优势,并促进空军部整体的人工智能就绪状态。
《空军部数据战略》确立了三个核心支柱:简化的数据发现与可访问性、增强的数据信任与互操作性、增强的数据驱动型决策。这些支柱详述了通过现代化空军部数据格局将实现的关键成果。为实现这些核心支柱,企业生命周期数据管理成功的四个构建模块提供了必要的基础:治理与责任、数据就绪、数据网格环境,以及数据驱动型人力资源。
本文件既是为立即行动奠定基础,也是实现数据就绪状态的指南,该状态将根据组织优先级演进至2031年。成功执行此战略将对于增强作战人员效能、提高作战效率以及确保空军部在日益以数据为中心的世界中保持竞争优势至关重要。
数据的必要性
空军部依赖于数据作为战略资产的无缝整合与利用,以执行其核心职能。掌握数据推动着空军的竞争优势,加速人工智能能力的整合,并确保对不断演变的威胁做出决定性反应。
利益相关方
空军部数据战略的利益相关方涵盖企业的各个层级。空军部首席数据与人工智能官负责管理该战略的实施,与空军部各组织及指定的空军部数据官密切合作,促进健全的企业决策管理监督。秘书处、职能部门、主要和战地司令部、直属报告单位以及空军国民警卫队层面的数据管理办公室和合规团队负责确保企业数据管理、数据质量、安全、隐私以及遵守数据管理法规。本战略适用于美国空军和太空军、空军后备队、空军国民警卫队的全体文职雇员和军职人员,以及有合同义务遵守空军部发布文件条款的人员。
范围
《空军部数据战略》适用于整个空军部企业内生成和管理的所有数据,包括所有密级和安全保护级别(非密、受控非密信息、机密、绝密和特别访问计划)的结构化、半结构化和非结构化数据。它引导空军部迈向一个高度可互操作的企业数据格局,以实现空军部内部、以及与外部战争部和联邦数据生态系统、以及盟友和联盟任务伙伴环境之间的有效整合。本战略承认某些数据领域在特定权限和治理结构下运作。国家情报总监办公室依据《美国法典》第50编第3024条管理情报界(IC)拥有的情报生产数据和系统,不在此战略范围之内。在适当情况下,本战略的实施将与情报界治理相协调,以确保方法相辅相成,避免权限重复。
指导原则
指导原则支持《2026年国防战略》、《2023年国防部数据、分析与人工智能应用战略》和《2026年战争部数据战略(待发布)》中概述的行动方针和目标,强调数据在维持竞争优势和实现有效人工智能整合方面的关键作用。
VAULTIS空军部数据:空军部将继续使其数据更具“VAULTIS”特性。这意味着空军部数据必须具有内在的“可见性”和“可访问性”;它将通过包含元数据的全面编目可被发现,并可供授权用户随时获取。为实现有效分析,数据必须通过清晰的文档记录“可理解”,并通过支持无缝集成的架构实现“可链接”。数据将具有“可信性”,通过跟踪其沿袭、来源和谱系的基础设施确保其质量和可靠性。它将具备“互操作性”,采用通用表示以促进系统间的数据交换,并且最重要的是,它必须保持“安全性”,通过强大的措施防止未经授权的发现、访问、使用或破坏。
去中心化数据管理:去中心化的数据管理方法将确保数据具备“VAULTIS”特性的责任分配给称为“数据领域”的组织结构。去中心化的数据模型赋能数据领域,这些领域是由最接近信息的主题事务专家领导的组织单元。每个领域都有权力和责任确保其数据既符合企业标准,也符合特定任务标准。这种方法在专业知识所在之处加以利用,以保证数据符合用途,同时给予领域使用最能满足其独特需求的基础设施的灵活性。
基础性数据治理:空军部内有效的数据管理和编排依赖于强大的数据治理。政策和标准为负责任和可持续的数据使用创建了框架。数据领域提供了问责、监督和倡导的结构,以确保领域内的数据生产和使用遵守相关政策和标准。每个空军部数据领域必须实施其自身的治理结构,并由一名“领域负责人”领导。这位将官或高级行政文职人员在企业治理论坛中代表其领域,行使其权力和影响力,确保其各自领域内的数据源得到适当的资源支持和成熟发展。企业数据治理结构在自主性和一致性之间取得平衡,通过对空军部数据领域的支持和监督确保企业目标的优先次序。集中式治理协调空军部内的去中心化数据管理实践,确保连贯的数据格局、通用的数据表示,并最大限度地减少数据不一致。
赋能和装备齐备的人力资源:正如安全是空军部每位人员的责任一样,执行以数据为中心的运营也要求所有空军部人员理解并履行其在数据方面的职责。赋能和装备人员包括提供资源以发展数据能力、采用具有明确职责的正式数据工作角色、建立治理、提供培训资源,并考虑人-机系统集成原则,包括用户体验和工作流优化。各级指挥官和主管需要获得支持资源和政策指导,以将数据中心性与其他任务需求一同优先考虑。空军部将以透明和问责的方式为数据计划提供资源,以建立信任并实现跨组织边界的协作。
愿景声明
实现授权空军部数据以任务所需的速度进行安全共享。
为实现授权空军部数据以任务所需的速度进行安全共享,我们将采用一种去中心化的数据管理范式,如图1所示,与《2024年国防部数据网格参考架构》保持一致。这种现代方法包含两个主要要素:一个强大的治理框架和一个精简的企业技术层。
在此模型下,通过数据领域将数据责任推向任务边缘。这些领域由最接近信息的专家领导,负责为企业生产有价值、相关和高质量的数据产品。将数据视为产品可确保数据资产经过精心设计和迭代整理,以满足用户需求和需求。
在企业层面,一个由中央资助的企业数据目录将作为所有数据使用者的单一入口。这个自助服务目录将提供对领域整理的数据产品的访问,直接提升空军部数据作为战略资产的价值、信任度和质量保证。
三个核心支柱描述了通过实施《空军部数据战略》将在空军部范围内实现的预期成果。它们支持每个领域高效和有效的任务达成。
支柱一:简化的数据发现与可访问性
支柱二:增强的数据信任与互操作性
支柱三:增强的数据驱动型决策
空军部在利用其庞大的数据资源方面面临重大挑战,危及了其与近似竞争对手保持同步的能力。这些挑战涉及治理和监督、技术实施以及组织和资源壁垒。
空军部当前的数据管理架构是碎片化且不一致的。元数据标记和数据编目不足,导致空军部大部分数据无法被发现和访问。对数据计划的企业资助的碎片化可见性和透明度侵蚀了协作和信任。空军部人员依赖集中式数据平台来获取可消费数据,这通常将数据访问限制在不完整的、用例驱动的数据流。广泛存在的点对点数据连接实践导致任务延迟、不必要的数据重复和更高的安全担忧。领域级别的数据就绪状态不足,阻碍了企业级别的全面信息管理和基于信息的决策。
治理与监督缺陷:空军部数据治理流程的成熟度是脱节且不一致的,导致数据管理碎片化和缺乏有效监督。
技术实施差距:空军部当前架构中缺少有效数据管理的关键技术组件。
组织和资源壁垒:对变革的抵制、有限的数据素养、领导支持不足以及资金挑战阻碍了有效空军部数据管理优化的采用。
《空军部数据战略》的愿景将通过四个关键构建模块实现:治理与责任、数据就绪、数据网格环境以及数据驱动型人力资源。这些构建模块是实现本战略三大支柱的基础。它们将通过支持以任务为中心和用户驱动的数据计划,使战略概念变为运营现实。
治理与责任
空军部提供一套强大的政策与治理体系,作为现代化空军部数据架构和管理实践的基础。有效的治理遵循联邦和战争部指导方针,同时保持敏捷性以适应变化并保持与战略目标的一致性。治理驱动的战略将通过概述成果和架构路线图(而非规定具体的技术解决方案)来协调空军部内的工作和优先事项。政策和实施实现战略愿景。空军部将继续制定数据政策,以指导合乎道德和有效的数据管理和使用,并严格评估现有政策,以确保与战争部和空军部战略目标保持一致。在去中心化数据管理范式内,数据领域将建立自己的治理机构,以确保关键数据管理人员的名册、确保有效的跨部门沟通并收集反馈。数据领域负责人和治理机构将确保领域内的数据源遵守战争部和空军部政策。空军部数据领导者将积极参与现有的数据治理结构,促进对企业数据就绪的共同问责。
数据就绪
空军部将通过将数据视为类似于人员和物资的战略资产来实现数据就绪,以支持更快、更明智的决策。当数据适合其预期用途并满足用户的需求和要求时,就实现了就绪状态。必须建立企业和数据领域特定的数据治理机构,以培育协作环境,确保标准得到优先排序和清晰、可实现并支持任务成果的发展。空军部首席数据与人工智能官将监督企业数据就绪,监控数据领域对现有标准的遵守情况,确保领导者和决策者对空军部数据资产的就绪状态有重要的洞察。
数据领域负责定义任何相关的领域特定数据就绪标准,并负责适当成熟其各自领域内的所有空军部数据源。数据源成熟度包括:
要作为一个军事部实现全面的数据就绪,从每个成熟数据源发布到企业的数据必须易于理解,并适合数据分析师、决策者以及人工智能模型等非人实体等数据使用者有效使用。数据领域将负责整理有价值、相关和可用的数据产品。
数据网格环境
采用去中心化的数据管理方法将使空军部与数据网格范式保持一致。空军部首席数据与人工智能官将提供一个精简的企业技术薄层,使空军部数据可被发现和共享。这套称为“数据网格环境”的自助服务工具将作为数据产品市场运作,使数据生产者和使用者能够在安全和可互操作的环境中发布和访问空军部数据。数据网格环境的关键特征将包括:
数据领域将负责将其数据产品发布到数据网格环境中。数据领域必须用高质量的数据填充这个协作环境,这些数据符合所有相关的数据就绪标准,以确保空军部在所有任务和职能中的数据驱动决策优势。
数据驱动型人力资源
空军部将通过战略投资和综合举措培养一支以数据为中心的人力资源。以数据为中心的人力资源拥有有效阅读、处理、分析以及与数据和关于数据进行沟通的必要知识和技能。数据素养包括理解数据源、识别数据质量问题、应用适当的分析方法以及做出基于证据的决策。空军部将根据不同角色开发数据素养能力,确保所有人员具备基本的数据意识,确保数据和分析专业人员具备高级分析能力。空军部将利用学习平台和在线资源,使所有人员都能方便地获取数据素养材料。
与国防部网络空间人力框架工作角色相协调的战略人力资源规划,包括定期评估空军部数据人力需求,将推动有针对性的招聘和培训战略,使人力资源发展举措与长期数据管理战略目标保持一致。空军部数据人力将通过在每个层级倡导数据素养,积极为以数据为中心的环境做出贡献。数据领域负责利用空军部提供的资源来理解并实施数据管理最佳实践。
《空军部数据战略》为以数据为中心的空军部确立了战略方向,认识到数据是在现代信息环境中获得决策主导权所必需的战略资产。拥抱“VAULTIS”原则、面向领域的去中心化数据管理和联合治理,将赋能空军部人员有效利用数据以提高任务效能。通过实施此战略,空军部将把数据转化为在所有任务集中的决定性优势。
现代化空军部数据生态系统是一项紧迫要求。不断演变的威胁和近似竞争对手的竞争需要及时和果断的行动。此战略将实现空军部内的数据透明度,纠正历史遗留的优先次序和资源配置偏差,以确保可跨领域访问的“VAULTIS”数据得到有效利用,实现部队就绪状态和杀伤力。空军部致力于采取分阶段的实施方法,并有明确的里程碑和问责制。空军部需要安全、可访问和可信的数据来保卫国土、威慑侵略并在冲突中获胜。
国防部指令 8140.01,《网络空间人力管理》,2020年10月5日
国防部指令 8140.02,《网络空间人力需求的识别、跟踪与报告》,2021年12月21日
国防部指令 8320.02,《国防部内数据、信息与信息技术(IT)服务共享》,2020年6月24日
国防部指令 8320.07,《在国防部内实施数据、信息与信息技术(IT)服务共享》,2017年12月5日
国防部手册 8140.03,《网络空间人力资格与管理计划》,2023年2月15日
战争部长办公室,《2026年国防战略》,2026年1月23日,可见于:https://media.defense.gov/2026/Jan/23/2003864773/-1/-1/0/2026-NATIONAL-DEFENSE-STRATEGY.PDF
国防部长办公室,《2023年国防部数据、分析与人工智能应用战略》,2023年6月27日,可见于:https://media.defense.gov/2023/nov/02/2003333300/-1/-1/1/dod_data_analytics_ai_adoption_strategy.pdf
国防部长办公室,《国防部数据战略:释放数据以推进国防战略》,2020年9月30日,可见于:https://media.defense.gov/2020/Oct/08/2002514180/-1/-1/0/DOD-DATA-STRATEGY.PDF
国防部长办公室,《联合全域指挥与控制(JADC2)战略摘要》,2022年3月,可见于:https:
摘要——随着人工智能的飞速发展,多智能体系统(MASs)正从经典范式向基于大基础模型(LFMs)的架构演进。本文对经典多智能体系统(CMASs)与基于大基础模型的多智能体系统(LMASs)进行了系统性的综述与比较分析。首先,在闭环协作框架内,本文从感知、通信、决策和控制四个基本维度对 CMASs 进行了回顾。在此框架之上,LMASs 通过集成 LFMs,将协作从低层级的状态交换提升至语义级的推理,从而在多样化场景中实现更灵活的协作与更强的自适应性。随后,本文通过架构、运行机制、自适应性及应用场景等维度,对比分析了 CMASs 与 LMASs 的异同。最后,本文提出了对 MASs 的未来展望,总结了当前面临的挑战与潜在的研究机遇。
索引词——人工智能,多智能体系统,大基础模型,智能体化 AI (Agentic AI)。
I. 引言
多智能体系统(MASs)已成为人工智能研究的核心范式,在机器人学 [1]、社交智能 [2] 及卫星系统 [3] 等多个学科中得到了广泛应用。受生物集群以及复杂分布式系统的功能需求启发 [4], [5],MASs 重点研究多个自主智能体如何通过交互实现全局协作或集体智能 [6]。与单智能体系统相比,MASs 为建模现实世界环境中多个自主实体之间的复杂交互与协作提供了一个自然框架 [7], [8]。
在本综述中,未融入大基础模型(LFMs)的 MASs 统称为经典多智能体系统(CMASs) [9], [10]。CMASs 依赖于显式设计的系统模型或特定任务的学习机制。从方法论角度看,现有的 CMASs 研究大致可分为基于模型的方法和基于学习的方法。基于模型的研究已逐步确立了多个经典问题领域和理论框架,包括一致性控制 [11]、编队控制 [12]、任务调度 [13] 以及生物启发优化 [14]。这些研究通常假设系统可建模且目标明确,以确保可证明的稳定性和性能 [9]。然而,在环境不可建模、系统动力学未知及部分可观测的场景下,依赖显式建模和控制设计往往受到限制。因此,诸如多智能体强化学习(MARL)等基于学习的方法作为重要的替代方案应运而生,使智能体能够在无需精确模型的情况下,通过交互学习协作策略 [15]。虽然这一范式部分缓解了复杂环境下的模型依赖问题,但 MARL 在采样效率、稳定性、可解释性和泛化性方面仍存在局限性 [16]。
CMASs 的局限性激发了对具备推理能力的更通用方法的探索,从而促进了大基础模型(LFMs)与 MASs 的集成 [17]。在 MASs 背景下,LFMs 充当智能体的认知核心。它们使智能体能够解析非结构化的多模态输入、保持上下文理解、对复杂任务进行推理,并生成高层级的动作或交互信息 [18]。这使得智能体的运行从 CMASs 中预定义的系统模型、手工规则或特定任务策略,转向语义级感知和基于语言的交互,从而实现更灵活的协作 [19]。这一演进标志着从特定任务、环境受限的 CMASs 向更具自适应性、通用性且具备认知能力的基于大基础模型的 MASs(LMASs)的根本性范式转换。通过利用 LFMs 的预训练知识和推理能力,这些系统能够执行复杂的步进式规划、知识检索和高层级决策 [20], [21]。如图 1 所示,与为固定环境量身定制的 CMASs 不同,LMASs 具有良好的泛化性,并能跨任务积累经验,支持在开放、动态场景下的灵活协作 [22], [23]。
现有的 LMASs 综述主要侧重于基于 LFM 的范式,并总结了系统架构、协作机制和应用场景 [8], [20], [24], [19], [25]。与这些孤立研究 LMASs 的综述不同,我们提出了一个连接 CMASs 和 LMASs 的统一视角。LMASs 并非 CMASs 的替代品,而是一种互补性的扩展,它利用高层级推理和泛化能力增强了经典系统,而 CMASs 在可靠的底层控制和理论保证方面依然不可或缺。通过对其架构和方法论关联进行细粒度、多维度的分析,我们旨在促进两者的协同演进,并为未来研究提供共同进步的路径。
本文的主要贡献如下: 1. 本综述全面概述了 MASs 的核心理论和最新进展,涵盖了 CMASs 和 LMASs。 1. 从理论和应用两个维度对比了 CMAS 和 LMAS 范式,突出了它们的异同,并揭示了范式转换如何重塑 MASs。 1. 讨论了 MASs 发展中的关键研究挑战和潜在的未来方向。
第二节对 CMASs 在多个关键维度上进行了结构化回顾。第三节从多个核心方面对 LMASs 进行了系统分析。第四节通过对比分析阐明了 CMASs 向 LMASs 范式转换背后的异同点及逻辑。最后,第五节讨论了 MASs 的未来研究方向和新兴趋势。
本定量研究专基于开源情报(OSINT)数据,运用网络理论、系统论与组织协同理论,对美国针对伊朗的大规模军事行动——“史诗怒火”行动——的初始阶段(2026年2月28日至3月13日)期间,美军平台间的战略协同网络进行了建模与分析。研究通过对官方政府公告、智库分析、海事与航空跟踪数据,以及专项OSINT报告的系统梳理,构建了一个包含40个节点(军事平台)和73条边(推断的协同关系)的社会网络。研究采用中心性度量、社区发现、时间序列分析与拓扑评估等方法,针对网络结构、平台中心性、时序演化及社区构成等四个研究问题,对网络进行了分析,并检验了十项假设。结果显示,该协同网络呈现出显著的小世界特性(σ = 4.084),具有较高的局部聚类系数(0.564)和较短的平均路径长度(3.573),但其度分布并不符合无标度特性。中心性分析识别出一个三层结构层级:电子战与网络平台(中介中心性0.227–0.323)充当连接不同作战社区的关键网络中介;航空母舰与空中加油机则发挥影响力枢纽(特征向量中心性最高达0.642)和连接骨干(度中心性最高达0.179)的作用;专业化打击与防御平台则活动在由Louvain算法识别出的八个不同的任务编组社区内。时间序列分析揭示了OSINT报告存在时间衰减现象,针对特定平台的报告多集中在初始的48小时打击阶段。在十项假设中,五项得到支持,两项未能得到支持,三项因数据限制而无定论。研究发现对(美国)战争部的部队设计、联合全域指挥控制(JADC2)架构、电子战投资重点,以及基于OSINT的作战评估方法发展具有启示意义。
关键词:战略协同,社会网络分析,“史诗怒火”行动,开源情报,多域作战,杀伤网,联合全域指挥控制
组织结构
| 章节 | 标题 | 描述 |
|---|---|---|
| 1 | 引言 | 确立研究问题,陈述目的和研究问题,呈现理论框架,讨论研究意义,并承认假设与局限性。 |
| 2 | 文献综述 | 回顾五类文献:联合作战与指挥控制(C2)理论、网络科学、波斯湾环境、开源情报(OSINT)方法论以及“史诗怒火”行动。识别研究空白。 |
| 3 | 方法论 | 详述研究设计、数据来源、编码程序、构念的操作化、社会网络分析(SNA)指标,以及效度/信度衡量。 |
| 4 | 结果 | 报告实证发现:网络描述性统计、中心性分析、时序演变、社区检测、假设检验和敏感性分析。 |
| 5 | 讨论 | 在现有文献背景下解释研究发现,讨论理论和实践意义,并为国防官员及未来研究提出建议。 |
| 6 | 结论 | 综合理论、方法和实践领域的贡献;讨论政策含义;并提出优先研究议程。 |
本文强调在生成逼真军事模拟时,融入健全的战术行为,这包括定义战斗战术、作战条令、交战规则以及作战概念。强化学习(RL)的最新进展使得RL智能体能够生成广泛的战术行动。本文使用一个多智能体地面作战场景,来展示机器学习(ML)应用如何在遵循给定目标的同时生成策略并下达命令。使用自然语言来下达条令和目标,以改善人类顾问与ML智能体之间的沟通。这使我们能够将目标与现有条令嵌入人工智能(AI)的推理过程中。该研究展示了成功运用自然语言使智能体实现不同目标。此项基础工作将增强未来RL智能体在军事行动中贯彻条令与规则的能力。
条令是军事力量为支持国家目标而指导其行动的基本原则体系。其是一套精心制定的权威思想体系,为解决军事问题建立了一个共同的参考框架。美国空军着力于提升战备状态和杀伤力,以推进威慑、竞争并取得胜利的解决方案。目标定位将目的、途径、手段和风险联系起来,以确保相应的反应与作战目标保持一致。目标定位过程由规划、情报和空中任务分配周期提供信息,确保作战目标与空中力量运用之间协调一致。
本更新版条令为空军人员提供了对目标定位作为一个过程及其在现代战场空间中的重要性的共同理解。概述了指导目标定位规划与执行的基本原则和框架。本出版物还概述了承担目标定位职责的组织,以及为在联合部队内消除冲突、整合目标提名与交战而进行的空中组成部队层级流程。本条令是作战层级空军人员的重要工具,使他们具备综合运用从威慑、竞争到大规模作战行动等全频谱冲突中目标定位流程的知识。由于空中力量具有在整个战区乃至全球创造效果的能力,空军人员的视角是目标定位的基础。此项条令强化了美空军在复杂挑战中取胜的能力。
研究了深度强化学习在开发自主兵棋推演智能体方面的潜力。探讨了兵棋推演环境对于学习系统设计的相关特征、学习框架与算法的选择。尽管深度强化学习已被证明能在多种游戏中达到超人类水平,但这些发现仅能部分迁移到实际兵棋推演中。这归因于现实世界的限制,例如资金与数据资源的可用性,以及兵棋推演领域可能很少能满足的系统架构要求。现代战争模拟环境的高度逼真性往往伴随着系统延迟,从而导致不切实际的训练时长。为了进行实证分析,采用了多种深度强化学习技术,将其适配于广受欢迎的《指挥:现代作战》模拟环境,并为此环境中的深度强化学习训练应用提供了概念验证。
本文结构如下。第二部分回顾了当前关于深度强化学习应用于兵棋推演的文献。第三部分结合深度强化学习的应用,阐述了兵棋推演的主要制约因素。第四部分讨论了在兵棋推演中定义有效深度强化学习算法所需的设计选择。第五部分介绍了模拟软件《指挥:现代作战》以及为实现更低延迟而开发的轻量化替代方案“战争模拟器”。第六部分,将研究发现应用于《指挥:现代作战》和“战争模拟器”中的简单兵棋推演场景。报告了不同强化学习方案在两者中的训练性能。结论与展望在第七部分。在附录中,汇集了关于传统搜索算法、强化学习及深度强化学习的背景概念,并讨论了如何为特定兵棋推演选择最合适的强化学习算法。
如果说过去两年大模型竞争的关键词是“推理能力”,那么 DeepSeek-V4 这篇技术报告给出的新关键词,可能是:百万级上下文的高效推理。
DeepSeek-AI 在论文《DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence》中发布了 DeepSeek-V4 系列的预览版本,包括两个 MoE 语言模型:DeepSeek-V4-Pro和DeepSeek-V4-Flash。前者总参数规模为 1.6T、每 token 激活 49B 参数;后者总参数规模为 284B、每 token 激活 13B 参数。两者共同指向一个目标:在保持较强通用能力的同时,原生支持100 万 token 上下文窗口。这不是简单地把上下文窗口“拉长”。真正难的是:当上下文扩展到百万 token,注意力计算、KV Cache 存储、推理延迟、训练稳定性都会迅速成为瓶颈。DeepSeek-V4 的核心价值,就在于它试图把“能处理长文本”推进到“能高效、常规化地处理长文本”。
过去的大模型长上下文能力,很多时候更像是一种“能力展示”:模型可以塞进很长的输入,但推理成本高、KV Cache 占用大、长文检索性能衰减明显,真正投入复杂业务流程并不容易。DeepSeek-V4 面向的场景更进一步:复杂 Agent 工作流;超长代码库理解与修改;跨文档、跨报告的系统分析;企业级知识库问答;长周期、多轮任务执行;未来可能出现的在线学习和持续记忆式系统。论文开篇指出,当前 test-time scaling 让推理模型能力提升明显,但传统注意力机制的二次复杂度限制了超长上下文和长推理链的发展。换句话说,如果推理越做越长、任务越做越复杂,模型就必须解决“长程信息处理的效率问题”。
DeepSeek-V4 可以理解为一次围绕“长上下文效率”的系统级升级:用混合注意力降低长序列计算和 KV Cache 成本,用 mHC 提升深层信号传播稳定性,用 Muon 优化器改善大规模训练收敛,再配合 FP4、MoE 通信计算重叠、KV Cache 管理等系统优化,把百万 token 上下文推向可用。论文称,在 100 万 token 上下文场景下,DeepSeek-V4-Pro 相比 DeepSeek-V3.2 只需要约27% 的单 token 推理 FLOPs和10% 的 KV Cache;DeepSeek-V4-Flash 进一步降低到约10% 的单 token 推理 FLOPs和7% 的 KV Cache。这组数字是理解 DeepSeek-V4 的关键:它的重点不是“更大”,而是让长上下文变得更便宜。
DeepSeek-V4 最重要的架构变化,是混合注意力机制:Compressed Sparse Attention,CSA与Heavily Compressed Attention,HCA。
CSA 的思路是:先把 KV Cache 沿序列维度压缩,每 m 个 token 压缩成一个 KV entry;然后再通过稀疏选择,让每个 query token 只关注 top-k 个压缩后的 KV entry。可以把它理解成:面对一本百万字的书,模型不是每次都逐字查找,而是先把书压缩成一系列信息块,再根据当前问题挑选最相关的信息块阅读。论文第 9 页的图 3 展示了 CSA 的结构:隐藏状态先经过 token-level compressor 生成压缩 KV,再由 Lightning Indexer 计算索引分数,选择 top-k 压缩 KV,最后进入共享 Key-Value 的 Multi-Query Attention。
HCA 的压缩更强:每 m′ 个 token 压缩成一个 KV entry,其中 m′ 远大于 CSA 中的 m。不同的是,HCA 不再做稀疏选择,而是在强压缩后的 KV 上保持 dense attention。这相当于用更粗粒度的“全局摘要”来维护长距离信息。论文第 11 页的图 4 展示了 HCA:它把更长片段的 KV 合并成少量 heavily compressed KV entries,并额外保留滑动窗口 KV,以补足局部细粒度依赖。
压缩注意力有一个天然风险:压缩会损失局部精细信息。DeepSeek-V4 因此在 CSA 和 HCA 中都加入了滑动窗口注意力分支,让模型始终能够访问最近一段未压缩的 token。这体现了一种典型设计平衡:远距离信息靠压缩,近距离依赖靠原始窗口。
DeepSeek-V4 另一个结构升级是Manifold-Constrained Hyper-Connections,mHC。传统 Transformer 依赖残差连接在层间传递信息。mHC 的目标是加强这种连接,同时避免普通 Hyper-Connections 在深层堆叠时可能出现的数值不稳定。论文的做法是:将残差映射矩阵约束到双随机矩阵流形,也就是 Birkhoff polytope。这样可以让映射的谱范数不超过 1,使残差变换具备非扩张性,从而增强前向传播和反向传播的稳定性。这部分虽然比较数学,但它背后的工程意义很清楚:当模型规模大、层数深、训练序列长时,任何微小的不稳定都可能被放大。mHC 是在为更大规模、更长上下文训练提供稳定性支撑。
DeepSeek-V4 采用 Muon 优化器更新大部分模块,同时保留 AdamW 用于 embedding、prediction head、RMSNorm 等部分模块。Muon 的核心特征是对更新矩阵做近似正交化。论文中使用了 hybrid Newton-Schulz iterations,以提升收敛速度和训练稳定性。值得注意的是,DeepSeek-V4 并没有只从模型结构上解决长上下文,而是把优化器、训练策略、数值稳定性和系统实现全部纳入同一套设计中。这也是这篇论文更像“系统工程报告”而不仅是“模型结构论文”的原因。
DeepSeek-V4 的预训练语料超过 32T token,包含数学、代码、网页、长文档等高质量数据。论文特别提到,DeepSeek-V4 更重视长文档数据构建,优先考虑科学论文、技术报告等具有学术价值的材料。具体训练规模上:DeepSeek-V4-Flash 训练 32T token;DeepSeek-V4-Pro 训练 33T token;训练序列长度从 4K 逐步扩展到 16K、64K,最终到 1M。这说明 DeepSeek-V4 的百万上下文不是后期简单外推,而是在训练过程中逐步引入长序列,使模型原生适应超长上下文处理。
DeepSeek-V4 的后训练采用两阶段范式:第一阶段,分别训练数学、代码、Agent、指令跟随等领域专家模型;第二阶段,通过On-Policy Distillation,OPD把多个专家能力整合到统一模型中。论文指出,基础模型先通过高质量领域数据做 SFT,再使用 GRPO 进行强化学习,形成多个领域专家;随后统一模型作为学生,在自身生成轨迹上学习教师模型的分布,以 reverse KL loss 进行多教师蒸馏。这点很关键。传统多能力融合经常面临“混合训练相互干扰”或“权重合并性能退化”的问题。DeepSeek-V4 选择用 logits-level 的 on-policy distillation,把不同专家能力压缩进一个统一参数空间。
在基础模型评测中,DeepSeek-V4-Flash-Base 虽然激活参数少于 DeepSeek-V3.2-Base,但在多数 benchmark 上超过后者;DeepSeek-V4-Pro-Base 则在知识、推理、代码、长上下文等方面全面领先 DeepSeek 系列前代基础模型。论文表 1 显示,在 LongBench-V2 上,DeepSeek-V4-Pro-Base 得到 51.5,高于 DeepSeek-V4-Flash-Base 的 44.7 和 DeepSeek-V3.2-Base 的 40.2。在后训练模型方面,论文表 6 给出了 DeepSeek-V4-Pro-Max 与多个开源、闭源模型的对比。DeepSeek-V4-Pro-Max 在 SimpleQA-Verified 上为 57.9,HLE 为 37.7,Codeforces rating 为 3206,SWE Verified 为 80.6,Toolathlon 为 51.8。论文同时强调,它在知识评测上缩小了与领先闭源模型的差距,但并未在所有维度超过闭源前沿模型。这类表述需要谨慎:DeepSeek-V4 的确在开放模型中表现强劲,但论文自身也承认,在部分知识、Agent 和闭源前沿比较中仍存在差距。
长上下文模型最容易被质疑的问题是:窗口很长,但模型是否真的能用上?论文在 1M-token context 下使用 MRCR 和 CorpusQA 评估长上下文能力。结果显示,DeepSeek-V4-Pro 在 MRCR 上优于 Gemini-3.1-Pro,但低于 Claude Opus 4.6;在 CorpusQA 上也优于 Gemini-3.1-Pro。图 9 显示,在 128K 以内,DeepSeek-V4 系列检索表现比较稳定;超过 128K 后性能有所下降,但到 1M token 时仍保持较强能力。这比单纯宣传“百万上下文”更重要:论文承认长上下文性能会随长度下降,但试图证明下降幅度仍在可接受范围内。
论文还专门评估了真实世界任务,这部分对产业读者更有参考价值。
DeepSeek-V4-Pro 在功能性中文写作任务中相对 Gemini-3.1-Pro 获得 62.7% 胜率;在创意写作中,指令跟随胜率为 60.0%,写作质量胜率为 77.5%。但在高复杂约束或多轮场景中,Claude Opus 4.5 仍有优势。
论文区分了 RAG 和 agentic search。DeepSeek-V4-Pro 相比 DeepSeek-V3.2 在搜索问答中明显提升;agentic search 相比普通 RAG 在复杂任务上表现更好,但成本只略高于标准 RAG。
DeepSeek 构建了 30 个高级中文专业任务,覆盖金融、教育、法律、科技等 13 个行业。评估显示,DeepSeek-V4-Pro-Max 相对 Opus-4.6-Max 的整体 non-loss rate 为 63%,优势主要体现在任务完成度和内容质量,但在格式审美、极简摘要和部分格式约束上仍有改进空间。
论文从 50 多位内部工程师收集约 200 个复杂研发任务,经过筛选保留 30 个任务作为评测集。结果显示,DeepSeek-V4-Pro-Max 的通过率为 67%,高于 Claude Sonnet 4.5 的 47%,接近 Claude Opus 4.5 的 70%,但低于 Opus 4.6 Thinking 的 80%。
DeepSeek-V4 的论文中很大篇幅用于基础设施,包括:MoE 专家并行中的通信计算重叠;TileLang 内核开发;batch-invariant 和 deterministic kernel;FP4 量化感知训练;长上下文 attention 的上下文并行;异构 KV Cache 管理;on-disk KV Cache 存储;面向 Agent 的沙箱基础设施 DSec。这些内容说明,百万 token 上下文不是靠单一算法实现的,而是模型架构、训练框架、推理系统、存储策略、工具调用基础设施共同协作的结果。尤其是 KV Cache 管理,论文指出 DeepSeek-V4 的混合注意力会产生不同类型、不同尺寸、不同更新规则的 KV entries,因此传统 PagedAttention 假设不再完全适用,需要定制化 KV cache layout。
DeepSeek-V4 的结论部分并没有只做乐观总结。论文明确提到,为追求极致长上下文效率,DeepSeek-V4 采用了较大胆的架构设计;为了降低风险,保留了许多初步验证有效的组件和技巧,这也使得架构相对复杂。未来需要更系统地研究,提炼出更本质、更简洁的设计。此外,论文还提到 Anticipatory Routing 和 SwiGLU Clamping 虽然能缓解训练不稳定,但其底层机理仍不充分清楚。未来方向包括进一步研究训练稳定性、探索新的稀疏维度、降低长上下文延迟、加强长程多轮 Agent 任务,以及加入多模态能力。这部分值得重视:DeepSeek-V4 不是一个“完美终点”,而更像是一次面向百万上下文时代的系统性预演。
DeepSeek-V4 最值得关注的地方,不只是 benchmark 分数,而是它提出了一个方向:大模型正在从短轮次问答系统,转向能够处理长文档、长任务、长推理链和长周期 Agent 工作流的系统。过去,模型像是一个聪明的答题者;未来,模型可能更像一个可以持续阅读、持续规划、持续执行的智能工作单元。而百万 token 上下文,正是这条路上的关键基础设施之一。DeepSeek-V4 的意义也在这里:它没有简单地把模型做大,而是试图把长上下文推理的成本降下来,让“长程智能”不再只是实验室里的演示能力,而更接近真实产品和真实工作流中的常规能力。
美海军陆战队作战出版物5-10《海军陆战队规划流程》最初于2000年1月以MCWP 5-1编号出版。自那时起,海军陆战队各指挥层级的部队一直使用海军陆战队规划流程来实施各类军事行动。过去十年中设计方法的使用表明,设计不仅仅是确立目标、目的和意图的概念性规划。
设计的一个更关键作用,是促进对当前态势的理解,以此作为寻求广泛解决方案的基础。虽然设计确立了问题的本质,但本次修订中纳入设计方法学,是为了帮助指挥官、参谋和规划人员确定问题集及其解决框架。本出版物中的设计方法学反映了一种理念,即充分的复杂性可能存在于战争的各个层级并贯穿整个冲突谱系,包括那些需要理解阻碍作战环境从当前状态向期望状态转变的问题集的战术情境。
在所有影响军事行动的关键因素中,时间是决定性的。海军陆战队规划流程通过促进直觉理解、明确指挥官意图以及在既定范式内运用任务与目的,帮助海军陆战队员赢得时间争夺战。另一个时间辅助工具是用于确定解决某一问题集的行动中哪些将具有决定性的重心分析技术。这些关于决定性的构想,通过主次努力和资源优先顺序,指导战斗力的集中。
本出版物主要面向拥有参谋的指挥官;然而,任何需要规划行动的陆战队员都应充分了解规划流程,以便能够确定问题、设想期望状态并制定实现该状态的方案。
规划绝不应被视为一项孤立的活动或流程。规划是指挥与控制的关键要素;规划、执行与评估构成了作战流程。规划是执行的基础,而评估则确定环境如何以及为何因执行而改变,从而为后续的规划和评估提供信息。虽然这种描述暗示了这三者之间存在顺序关系,但这三项基本的军事活动本质上是循环的。它们各自以及共同地,通过无数相互关联的事件,随着时间的推移而相互作用和演变。
由于态势持续变化,陆战队员需要在相对不确定的情况下做出决策。虽然寻求更多信息以减少不确定性是人之常情,但这通常以牺牲时间为代价。在动态环境中取得成功,要求陆战队员进行批判性思考,审视问题的本质以及行动的目的,并在整个作战流程中不断学习和适应。
作战环境中的许多因素,其中一些是无法控制的,导致规划工作变得复杂且非线性。这些因素包括:敌方行动;其他行为体和利益相关方的行动;其他友好、中立和威胁网络;更新的情报;变化的资源;上级指挥机构修订的指导;作战行动提供的输入;以及下属、相邻和支援单位的同步规划。规划人员和指挥官应预期问题会在他们试图解决的过程中不断演变。
尽管本出版物按顺序介绍了海军陆战队规划流程的六个步骤,但规划很少以直接、线性的方式进行。例如,在行动方案制定和行动方案推演步骤中获得的理解,常常要求规划人员重新审视规划流程中的问题界定步骤。为了更好地理解不存在僵化、固定的规划顺序,规划人员需要理解对有效应用海军陆战队规划流程至关重要的规划层级。
概念规划是最高层级的规划。它确立目标、目的和意图,并涉及制定广泛的行动概念。一般而言,概念规划是一个由分析支持的创造性综合过程。它通常对应于战争艺术。为军事行动的整体实施制定战术、战役或战略概念,就是概念规划。
层级中最低层级的是详细规划,它关注将宽泛的概念转化为完整且现实的计划。详细规划源自概念规划,通常对应于战争科学,并涵盖实施的具体细节。详细规划通常是将概念分解为可执行任务的分析过程,尽管也可能涉及一些综合要素。详细规划解决与部队机动、维持、管理和指挥相关的调度、协调或技术问题。详细规划的例子包括装载计划和空中任务指令。与概念规划不同,详细规划不涉及目标的确定。详细规划是制定实现目标的具体行动。
介于最高和最低层级之间的是职能规划,它包含概念规划和详细规划两方面的要素。职能规划关注为离散的职能活动制定和整合支援计划,这些活动至少包括机动、火力、后勤、情报、信息和部队防护。通常,由于概念规划的重要性,指挥官会指导此层级的计划制定。虽然指挥官也参与职能规划和详细规划,但这些规划的具体方面通常由规划人员和参谋制定。概念规划为所有后续规划提供基础,并应从一般性进展到具体性。例如,指挥官的作战方法引伸出部队的作战概念以及支援性的职能概念。这些概念进而引伸出执行的具体细节。
规划的动态并非单向运作。概念规划必须对职能限制做出响应。例如,部署时间表的现实情况可能决定运用方案。职能规划反过来必须对执行的更详细需求做出响应。这样,各层级的规划相互影响。概念、职能和详细规划很少按顺序进行,因为态势和可用信息在不断演变。虽然概念、职能和详细规划是按顺序描述的,但在实践中,由于不确定性和时间因素,它们是以更具互动性的方式进行的。
指挥官可以根据迹象和预警主动开始规划,或响应上级指挥机构的特定指导和指示。规划流程旨在促进指挥官、规划人员、参谋和下属指挥官之间对给定问题的性质及解决选项的理解。由此产生的计划可被视为假设,将通过执行和评估进行检验和完善。海军陆战队规划流程的六个步骤是——
在整个规划过程中,指挥官和规划人员必须努力增进对问题集、计划以及作战环境动态的理解。首席规划人员必须在参谋机构内寻求共识,包括那些未分配到核心规划团队的人员。为指挥官和主要参谋军官提供针对即将进行的简报的聚焦性、预备性阅读材料,并给予足够的理解时间,将使领导者和规划人员更好地参与实质性讨论。预先号令和其他聚焦性沟通极大地促进了同步和并行规划,同时推动了更高程度的整合。在规划、简报和命令的各个方面使用视频、图形和其他现代媒体,可以极大地增强认知和理解。