本文提出一种运动规划算法,旨在引导被称为玩家智能体的主体,在多智能体三维城市空中环境中实现最优路径规划。该方法集成了基于采样的路径规划器、无模型最优控制以及一个用于预测其他智能体运动的认知层次模型。每个玩家通过在环境中构建一条路径,并根据其在线观测以及协作玩家的观测,随着环境障碍空间的变化而动态地重新规划该路径。认知层次模型预测环境中每个智能体的行为,同时采用高斯过程分类方法,通过观测每个智能体的运动学动力学距离,实时估计未知智能体的理性层级。一旦推断出另一个智能体的运动规划策略,玩家智能体便基于每个智能体的预期运动构建预测的障碍空间,以避免潜在的碰撞。随后,每个玩家使用一个Q学习控制器沿其规划的路径行进。我们在包含四个和十个智能体的三维城市空中环境的数值实验中验证了所提方法的有效性。我们证明,该方法能有效减少智能体到达目标所需行进的距离,降低碰撞风险,并防止死锁。
在过去二十年中,无人机的飞行技术取得了显著进步。这些无人机有着广泛的用途,例如包裹递送、搜索与救援、航空测绘与摄影,以及电力线巡检等许多在地面或由更大、机动性较差的飞行器难以完成的任务。因此,人们更多地考虑如何在城市空中环境中同时使用大量无人机,这个问题被称为城市空中交通。近年来,城市空中交通已成为这些无人机面临的主要挑战,存在诸多困难亟待克服。例如,实时避障和安全的运动规划仍被认为是机器人运动规划的必要发展方向,并面临众多挑战。在现实环境中,运动规划比精确观测起点与目标点之间的障碍物并规划绕行路径更为复杂。相反,机器人可能需要克服各种困难,例如障碍空间随时间变化的动态环境,以及存在噪声的感知系统。为了在动态环境中安全规划路径,这些飞行器不仅需要考虑当前观测到的障碍空间,还需要通过先发制人地规避潜在的未来障碍物和对抗性障碍物来考虑未来的碰撞。当多个智能体同时存在于同一环境中时,这一挑战会变得更加严峻,因为其他具有未知目的地和未知路径的智能体可能会干扰自主机器人的规划。此外,这些路径可能还需要考虑机器人所受的运动学动力学约束,这影响了机器人基于物理约束(如最大速度和加速度)的运动方式。在本工作中,我们寻求一种适用于动态环境中分布式通信网络的可扩展多智能体运动规划方法。我们分别考虑了此问题先前概述的每个组成部分,并对它们逐一进行了处理。