现代空天防御系统日益依赖自主决策来协调大量拦截弹应对多个来袭威胁。传统的武器-目标分配(WTA)算法,包括混合整数规划和基于拍卖的方法,在需要类人推理和自适应优先级排序的动态、不确定战术环境中,显示出局限性。本文介绍了一种大语言模型驱动的WTA框架,将广义智能整合到协同导弹制导中。所提出的系统将战术决策过程构建为一个推理问题,其中大语言模型评估拦截弹、目标和被防御资产之间的空间与时间关系,以生成实时分配。与经典优化方法不同,该方法利用上下文任务数据(如威胁方向、资产优先级和接近速度)进行动态自适应并减少分配切换。一个专用的仿真环境同时支持静态和动态分配模式。结果展示了在一致性、适应性和任务级优先级排序方面的改进,为将广义人工智能集成到战术制导系统中奠定了基础。
图1:所提出的LLM驱动WTA架构示意图。
LLM驱动的动态武器-目标分配框架
本工作考虑一个被防御资产的场景,其运动学和约束条件与第II节相同,所有位置和速度在一个覆盖被防御区域(例如,本地东北天坐标系)的共享全局笛卡尔坐标系中表示。假设存在一个集中式协调器,能完全感知拦截弹、目标和资产的状态。目标是保护高优先级资产、减少拦截时间,并避免频繁的重新分配。大语言模型基于任务上下文进行推理,以生成一个可行的分配向量,而无需任何预定义权重。
本文介绍了一种基于推理的动态武器-目标分配框架,该框架将大语言模型(LLM)集成到协同导弹制导的控制理论决策过程中。该方法用大语言模型驱动的推理取代了手动调整的替代成本函数,从而允许直接解释与任务相关的信息,如几何关系、时序和资产优先级。通过保持分配与制导之间的经典分解,该框架在增强上下文适应性的同时,仍与现有控制架构兼容。
在多资产防御场景中的仿真研究表明,该基于推理的系统能够提供一致且可解释的分配方案,减少不必要的重新分配,并在不确定条件下保持任务级协调性。将大语言模型作为推理模块集成,实现了灵活的、类人的优先级排序,并在不同战术条件下实现了稳健的决策。所呈现的结果概念验证了,在面向控制的分配问题中,高层推理可以补充或部分替代显式优化。未来的工作将侧重于与既有优化算法进行全面的基准测试,评估对不同大语言模型架构的敏感性,并开发将确定性优化与上下文推理相结合的混合框架,以在自主防御系统中实现可靠且可解释的决策支持。