无人机在民用与商用领域应用日益广泛,但其推广进程正受制于陡峭的学习曲线与复杂的手动控制器操作门槛。为破解此瓶颈,本项目深入探究语音控制导航技术,旨在消弭人类自然语言与无人驾驶航空器航行控制之间的隔阂。该系统基于模块化Docker容器化架构构建,依托ArduPilot SITL与Gazebo仿真平台,在模拟环境中完成了飞行动力学与基于传感器的避障功能开发及验证。语音控制架构采用流水线式处理逻辑:首先通过Whisper.cpp捕获音频信号,继而经由基于规则的唤醒词与休眠词系统过滤输入,最终利用轻量级机器学习分类器fastText实现意图识别,并将其转化为MAVLink控制指令。系统性能评估显示,其在将文本解析为MAVLink指令方面表现出极高效率,平均实时处理延迟仅为2.2毫秒。然而,端到端流水线的识别准确率对环境声学干扰极为敏感,在安静环境下可达82.5%,而在高噪声条件下则降至62.5%。此外,本项目亦揭示了非受控环境下基于音频的无人机控制所固有的可靠性缺陷及安全性权衡难题。总体而言,本研究成功验证了语音控制无人机界面的可行性,为构建便捷、简捷的人机交互范式提供了有力的概念验证。