本文强调在生成逼真军事模拟时,融入健全的战术行为,这包括定义战斗战术、作战条令、交战规则以及作战概念。强化学习(RL)的最新进展使得RL智能体能够生成广泛的战术行动。本文使用一个多智能体地面作战场景,来展示机器学习(ML)应用如何在遵循给定目标的同时生成策略并下达命令。使用自然语言来下达条令和目标,以改善人类顾问与ML智能体之间的沟通。这使我们能够将目标与现有条令嵌入人工智能(AI)的推理过程中。该研究展示了成功运用自然语言使智能体实现不同目标。此项基础工作将增强未来RL智能体在军事行动中贯彻条令与规则的能力。