本文提出了一种离线语言支持工具,用于辅助飞行员训练及空战作战中的战术决策。该系统采用检索增强生成(RAG)技术,利用从条令和战术手册中提取的内容回答自然语言问题。系统完全基于开源组件构建,在本地完成文本预处理、嵌入生成和语义搜索,确保全离线功能。通过涉及空战手册的用例展示了当前能力,并讨论了在机载任务系统、飞行模拟器和训练环境中的潜在应用。源代码采用模块化设计,拟公开发布以支持后续扩展与集成。
空战任务通常需要快速可靠地获取战术信息,而这些信息往往分散在冗长复杂的手册中。在规划阶段甚至飞行过程中,飞行员和任务规划人员可能需要迅速查阅这些内容。然而,手动查阅通常缓慢且不切实际,尤其是在无法或不允许访问互联网的环境中。以自然高效的方式与技术文档交互,在国防领域中正变得愈发有价值[Möbius et al., 2023]。自然语言处理(NLP)的最新进展,特别是大语言模型(LLM)的发展,使得构建能够利用文档信息以通俗语言回答用户问题的系统成为可能[Brown et al., 2020, OpenAI, 2023]。然而,大多数此类工具依赖于云服务,这限制了它们在敏感或无网络连接环境(如军用飞机或安全模拟器)中的应用。为弥补这一空白,我们提出了一种离线语言支持工具,该工具使用检索增强生成(RAG)[Lewis et al., 2020],基于条令手册提供有用的答案。该系统将文档搜索与本地语言模型相结合,允许用户以自然语言提问,并获得相关且具有上下文感知的回答。系统完全采用开源工具构建,可完全离线运行,适用于机载系统、模拟器和训练环境。系统采用模块化设计,可适配不同类型的文档。本研究的主要贡献在于设计与实现了一款完全离线的战术工具,帮助用户访问不应在线处理的敏感文档。我们通过空战手册的实际示例展示了其工作原理,并说明了它如何在空战场景中支持决策与训练。我们还提出了一个由专家参与的验证流程,以检查该工具所提供答案的质量与实用性。
图2:离线战术辅助系统架构概览